Description du poste Contexte Dans le cadre du développement de solutions d’intelligence artificielle, l’équipe souhaite renforcer ses capacités sur des projets basés sur les LLM (Large Language Models). Les travaux portent sur la mise en place d’applications exploitant des données internes, avec des enjeux de performance, de coût et de qualité des réponses. L’environnement est orienté innovation avec : intégration de modèles de type Transformer mise en œuvre de solutions RAG exploitation de bases vectorielles développement d’API pour exposition des services IA industrialisation et monitoring des usages Le poste s’inscrit dans un contexte de production avec des contraintes fortes de scalabilité, latence et fiabilité. Missions principales Développer des applications IA basées sur Python Concevoir des architectures utilisant des modèles de type Transformer Implémenter des solutions RAG Intégrer et exploiter des modèles pré-entraînés (fine-tuning) Optimiser les performances (temps de réponse, mémoire) Mettre en place des API (synchrones / asynchrones) Assurer la qualité du code (tests, linting, bonnes pratiques) Mettre en place l’observabilité des systèmes IA (LangSmith) Gérer les données et pipelines ML (DVC, bases vectorielles Profil recherché Compétences techniques Langages & Développement Python avancé (POO, générateurs, gestion mémoire) Bonne compréhension des différences Python / Java / C Maîtrise du GIL et des limites de performance Qualité & Bonnes pratiques Utilisation de linters (Flake8, Pylint) Respect des standards (PEP8) Gestion des copies (shallow vs deep copy) IA & Machine Learning Compréhension des Transformers et mécanisme d’attention Connaissance des modèles NLP (BERT, GPT, Mistral) Fine-tuning de modèles Evaluation de modèles (ROUGE, BLEU, G-Eval) Architecture IA Mise en œuvre de RAG Gestion de la fenêtre de contexte et température Différences RNN / LSTM / Transformers Données & Stockage SQL (dont Materialized Views) Bases vectorielles (Pinecone, Chroma, Milvus) Feature Engineering Outils & Frameworks LangChain / LangGraph LangSmith (observabilité) DVC (versioning de données) Frameworks Python fullstack (ex : Reflex) 3. Compétences fonctionnelles Capacité à concevoir une architecture IA complète Analyse de performance et optimisation Capacité à industrialiser des solutions IA Compréhension des contraintes de production (latence, coût) 4. Profil recherché Expérience de 8 ans minimum en développement Python ( niveau avancé) Expérience sur des projets IA / NLP / LLM Bonne compréhension des architectures modernes Capacité à travailler en autonomie
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.