Concevoir, entraîner, optimiser et déployer des modèles de Machine Learning et Deep Learning (NLP, LLM, embeddings).
Développer et maintenir des pipelines ML robustes (entraînement, évaluation, monitoring, CI/CD).
Construire des architectures RAG incluant : ingestion de documents, stratégie de chunking, embeddings, vector stores, pipelines de retrieval & génération.
Implémenter des applications LLM avec LangChain / LangGraph (agents, tools, retrievers, flows).
Déployer des microservices IA (API FastAPI / Flask) et gérer leur scalabilité en production.
Optimiser l'inférence et les performances : latence, consommation GPU, parallélisation, batching.
Collaborer avec les équipes Data Engineering, Produit et Dev pour industrialiser les solutions.
Surveiller les modèles en production (drift, performance, dérive des données).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.