Ingénieur data & ia tal/nlp (h/f)

Palaiseau

CDI

Publiée le 16 décembre

Description de l'offre

Nous recrutons un Ingénieur Data & IA TAL / NLP, spécialisé dans les modèles de langage, les systèmes d'inférence à grande échelle, et les frameworks agentiques modernes.
Type de contrat : CDI, salaire selon expérience, forfait jours Syntec
Expérience requise : stage NLP a minima si junior, expérience 1 à 5 ans en projet NLP et architecture cloud / on-premise si profil expérimenté
Lieu de travail : École polytechnique (Palaiseau, 91) 1 à 2 jours par semaine, sinon télétravail
Vous rejoindrez notre équipe NLP/LLM pour concevoir, optimiser et déployer des systèmes IA de pointe : recherche sémantique, RAG avancés, fine-tuning, distillation, quantization, graphes de connaissances et systèmes agentiques orchestrés.
Vos missions :
- Concevoir, entraîner, fine-tuner et optimiser des modèles de langage (LLM open-source ou propriétaires)
- Implémenter, benchmarker et améliorer des pipelines RAG de nouvelle génération : Retrieval, filtering, ranking, Evaluation quantitative/qualitative des performances, Robustesse multilingue (français / anglais)
- Évaluer et optimiser des modèles d'embeddings : BGE, E5, Qwen Embedding, GritLM, SFR-Embedding, etc., Comparaison de performances sur nos cas d'usage internes, Sélection et ajustement de modèles pour différents contextes (dense, hybrid, reranking)
- Construire des systèmes agentiques via : LangChain / LangGraph, LlamaIndex, OpenAI Agents SDK, ou autres frameworks avancés d'orchestration LLM
- Concevoir des pipelines robustes pour la collecte, génération et nettoyage de données complexes
- Mettre en place des stratégies d'optimisation d'inférence (quantization, distillation, pruning, batching, caching)
- Développer des protocoles d'évaluation rigoureux (benchmarks, stress tests, LLM-as-a-judge, datasets internes)
- Collaborer étroitement avec les équipes engineering et produit pour intégrer vos solutions en production
Profil recherché :
- Master/Ingénieur/PhD en machine learning, NLP, informatique ou domaine associé
- Souhaité : 2-5+ ans d'expérience en NLP/LLM ou IA appliquée
- Excellente maîtrise de Python, PyTorch (ou TensorFlow) et HuggingFace Transformers
- Expérience concrète dans la mise en œuvre de pipelines RAG complets et robustes, l'évaluation d'embedding models (BGE, Qwen, E5, etc.) et la comparaison de retrieveurs
- Compétence confirmée avec des frameworks agentiques : LangChain, LangGraph, LlamaIndex, OpenAI Agents SDK, ou équivalents
- Connaissance des modèles open-source (Llama, Mistral, Qwen, Gemma.) et des techniques de fine-tuning (LoRA, QLoRA, adapters)
- Connaissances pratiques en architecture de déploiement IA (Docker, APIs, scaling, monitoring)
- Capacité d'analyse, autonomie, rigueur scientifique et communication claire
- Adaptabilité et intérêt marqué pour les approches open-source

Postuler

Créer une alerte

Sauvegarder

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.