Au sein de la R&D Netvibes, l'équipe Sourcing & Standardization est en charge du développement de composants pour l'acquisition, le traitement, le stockage et l'exploitation de données à très large échelle.
Le stage se déroulera dans le cadre du service PartSupply de la 3DEXPERIENCE Marketplace, offrant un accès unique à un riche catalogue de composants mécaniques, électriques et électroniques, mis à disposition par des milliers de fournisseurs à travers le monde.
La similarité entre composants est au cœur de l’expérience PartSupply, aussi bien pour la recherche d’objets similaires, la classification de pièces et d’assemblages, que pour la standardisation de catalogues clients.
Les composants sont organisés dans un graphe de similarité 3D, puis exploités par des algorithmes d’apprentissage statistique.
L’objectif de ce stage est d’explorer des approches multimodales, notamment textuelles, en exploitant les embeddings de titres, paramètres, descriptions, documentations, etc., afin d’améliorer la structuration et le regroupement des composants.
Une deuxième partie du stage sera consacrée à l’exploration de l’usage des LLMs, notamment pour la description automatique, la classification et la normalisation des données.
Vos missions :
- Réaliser un état de l’art sur le clustering, les embeddings, les mesures de similarité et les approches associées.
- Calculer et évaluer des embeddings pour le calcul de similarité.
- Intégrer ces embeddings dans le graphe et mesurer leur impact sur le clustering.
- Explorer l’usage de LLMs pour la standardisation et la classification des composants.
Vos qualifications :
Etudiant.e en cursus BAC+5, en école d'ingénieurs ou formation Universitaire spécialité Data Science / Big Data / Machine Learning, vous êtes à la recherche d'un de 6 mois à partir de janvier 2026.
Connaissances solides en algorithmique et structures de données.
Bonne maîtrise des technologies d’apprentissage statistique et d’analyse de données.
Maîtrise des langages Java et Python.
Connaissance des architectures scalables et distribuées.
Bonne maîtrise de l’anglais à l’oral et à l’écrit pour la rédaction de documentation.
Des connaissances des frameworks de Machine/Deep Learning est un plus.
Des connaissances en moteurs de recherche et bases de données sont un plus.
Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans.
Principaux avantages et bénéfices :
Environnement multiculturel
Cadre de travail convivial axé sur le bien-être et la santé (salles de sport & de musique, conciergerie…)
Engagement en faveur de la diversité et de l’inclusion
Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.