Au sein du groupe, vous rejoindrez le Data & IA Hub, centre de compétences en Data & IA pour les 26 pays du groupe SOCOTEC. Le Hub connaît une forte croissance et travaille sur des projets internes ainsi que chez les clients du groupe.
Description du poste
Vous intégrerez une équipe composée de Data Scientists, Data Engineers et ML Engineers.
* En mode projet, vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement. Vous contribuerez au développement des 4 axes principaux du groupe :
o Inspection 4.0 : développements d’algorithmes de computer vision et NLP pour soutenir les experts métiers sur le terrain
o Assistants SOCOTEC : développement d’agents personnalisés pour les services du groupe (RAG, text-to-SQL, …)
o IA+X pour de nouveaux services : techniques d’hybridation entre physique et IA (jumeau numérique, PINN)
o Extraction d’information à partir de documents et de plans
* Vous choisirez un sujet de R&D qui vous confrontera à l’état de l’art du domaine, avec possibilités de publication scientifique. Les thèmes proposés sont :
o Inspection 4.0 : Machine learning appliqué à l'inspection des ouvrages d'art
o Auto-completion de contenu technique pour la rédaction de rapports
o Agents de Knowledge Management avec techniques RAG avancées
o Smart speech-to-text avec extraction intelligente d'informations
o Computer Vision : détection et classification de composants électriques
Le travail sera fait en collaboration avec une équipe de développeurs pour développer les modèles et héberger les livrables sur une plateforme web AWS.
Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de votre code.
Le stage pourra être basé à Palaiseau ou à Lyon.
Qualifications
* Étudiant(e) en dernière année de Master en Data Science / Machine Learning ou école d’ingénieur avec spécialisation en data et intelligence artificielle.
* Bonnes connaissances en statistiques, modélisation et analyse de données (analyse factorielle, régressions, clustering, etc.).
* Maîtrise du langage Python et des principales bibliothèques pour la data science (pandas, NumPy, scikit-learn, matplotlib).
* Familiarité avec les bases de données relationnelles (SQL) et les environnements de développement collaboratif (Git, GitLab, Jupyter Notebooks).
* Connaissances de base en algorithmes de machine learning et de deep learning, avec une première expérience sur un framework comme TensorFlow, Keras ou PyTorch.
* Intérêt marqué pour les modèles de langage (LLMs) et l’IA générative : compréhension des principes de transformers, fine-tuning, embeddings et prompt engineering.
* Expérience avec des outils ou bibliothèques comme LangChain serait un plus.
* Connaissance des environnements cloud (notamment AWS : Lambda, S3, Timescale) appréciée.
* Goût affirmé pour les technologies innovantes et l’expérimentation.
* Curiosité scientifique et capacité à apprendre rapidement de nouveaux concepts.
* Polyvalence, rigueur et autonomie dans la conduite des analyses.
* Esprit d’équipe et aisance dans un environnement collaboratif.
* Anglais courant et technique.
Informations complémentaires
En intégrant le Data & IA Hub, vous entrerez dans une entité dotée de l’esprit Start-up.
SOCOTEC financera deux certifications reconnues internationalement : Cloud Practitioner AWS et AWS Certified Machine Learning – Specialty.
* Cohésion & Dynamisme
* Performance & Qualité
* Innovation & Excellence Technique
Ce stage s’inscrit dans une démarche de pré-embauche. Les stagiaires démontrant leur autonomie et leur maîtrise technique se voient régulièrement proposer une offre en CDI à l’issue de leur stage.
Des opportunités d’évolution à l’international existent également, notamment en VIE ou CDI aux États-Unis, au Royaume-Uni, en Italie, en Espagne, aux Pays-Bas et au Vietnam.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.