Nous recrutons un Ingénieur Data & IA TAL / NLP, spécialisé dans les modèles de langage, les systèmes d'inférence à grande échelle, et les frameworks agentiques modernes.
Type de contrat : CDI, salaire selon expérience, forfait jours Syntec
Expérience requise : stage NLP a minima si junior, expérience 1 à 5 ans en projet NLP et architecture cloud / on-premise si profil expérimenté
Lieu de travail : École polytechnique (Palaiseau, 91) 1 à 2 jours par semaine, sinon télétravail
Vous rejoindrez notre équipe NLP/LLM pour concevoir, optimiser et déployer des systèmes IA de pointe : recherche sémantique, RAG avancés, fine-tuning, distillation, quantization, graphes de connaissances et systèmes agentiques orchestrés.
Vos missions :
- Concevoir, entraîner, fine-tuner et optimiser des modèles de langage (LLM open-source ou propriétaires)
- Implémenter, benchmarker et améliorer des pipelines RAG de nouvelle génération : Retrieval, filtering, ranking, Evaluation quantitative/qualitative des performances, Robustesse multilingue (français / anglais)
- Évaluer et optimiser des modèles d'embeddings : BGE, E5, Qwen Embedding, GritLM, SFR-Embedding, etc., Comparaison de performances sur nos cas d'usage internes, Sélection et ajustement de modèles pour différents contextes (dense, hybrid, reranking)
- Construire des systèmes agentiques via : LangChain / LangGraph, LlamaIndex, OpenAI Agents SDK, ou autres frameworks avancés d'orchestration LLM
- Concevoir des pipelines robustes pour la collecte, génération et nettoyage de données complexes
- Mettre en place des stratégies d'optimisation d'inférence (quantization, distillation, pruning, batching, caching)
- Développer des protocoles d'évaluation rigoureux (benchmarks, stress tests, LLM-as-a-judge, datasets internes)
- Collaborer étroitement avec les équipes engineering et produit pour intégrer vos solutions en production
Profil recherché :
- Master/Ingénieur/PhD en machine learning, NLP, informatique ou domaine associé
- Souhaité : 2-5+ ans d'expérience en NLP/LLM ou IA appliquée
- Excellente maîtrise de Python, PyTorch (ou TensorFlow) et HuggingFace Transformers
- Expérience concrète dans la mise en œuvre de pipelines RAG complets et robustes, l'évaluation d'embedding models (BGE, Qwen, E5, etc.) et la comparaison de retrieveurs
- Compétence confirmée avec des frameworks agentiques : LangChain, LangGraph, LlamaIndex, OpenAI Agents SDK, ou équivalents
- Connaissance des modèles open-source (Llama, Mistral, Qwen, Gemma.) et des techniques de fine-tuning (LoRA, QLoRA, adapters)
- Connaissances pratiques en architecture de déploiement IA (Docker, APIs, scaling, monitoring)
- Capacité d'analyse, autonomie, rigueur scientifique et communication claire
- Adaptabilité et intérêt marqué pour les approches open-source
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.