Alternance de 2 ans - démarrage septembre 2026. Deux ans, c’est suffisant pour faire plus que contribuer : tu prendras la main sur des sujets de bout en bout, avec une vraie responsabilité sur la qualité et la performance de nos pipelines IA en production. Intégré(e) à notre équipe d’AI engineers, tu contribueras à développer des applications d’IA performantes dans un contexte où la précision est critique (conformité, cybersécurité, grands comptes). Ce que tu feras au quotidien : Pipelines RAG & orchestration IA RAG : concevoir et améliorer des pipelines de Retrieval-Augmented Generation (ingestion documentaire, chunking, embedding, retrieval, génération) Orchestration : workflows IA agentiques (chaînage, gestion d’état, routing conditionnel, fallbacks) Routage LLM : gestion multi-providers (routage, fallbacks, suivi des coûts et latences) APIs : développement d’endpoints pour exposer les services IA Évaluation, qualité & observabilité (ownership attendu sur 2 ans) Frameworks d’évaluation : mise en place et industrialisation d’un framework de mesure de qualité - fidélité, pertinence, précision du contexte, robustesse Observabilité : implémentation de traces sur les appels IA (latence, coûts, tokens, debugging), dashboards de suivi qualité Benchmarks : évaluation comparative de modèles, de stratégies de prompting, d’architectures RAG Hallucinations : contribution aux stratégies de mitigation dans un contexte où la précision est non négociable Régressions : construction de suites de tests automatisés pour détecter les dérives de qualité au fil des releases Optimisation & industrialisation Optimisation : analyser et réduire la consommation de tokens et les coûts d’inférence Documentation : documenter les choix techniques et résultats d’expérimentations Sécurité : bonnes pratiques pour protéger les pipelines et données sensibles Sur 2 ans, tu auras l’opportunité de prendre la responsabilité complète d’un pan du système (typiquement l’évaluation qualité et l’observabilité IA) : définir la stratégie, l’implémenter, la faire vivre, et en être le/la référent(e) technique au sein de l’équipe. Environnement technique Python, LLMs open source, architectures RAG, orchestration d’agents, vector stores, graph databases, infrastructure cloud souveraine (EU). Stack moderne, en constante évolution.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.