Vous serez responsable de la gestion, de l'optimisation et du déploiement de grands modèles de langage (LLM - Large Language Models) dans des environnements de production.
Vous participerez à la mise en place d'applications basées sur de l'IA Générative pour répondre aux besoins des directions métiers et de la DSI. Vous sélectionnez, fine-tunez, évaluez et déployez des LLM en collaboration avec les autres Ingénieurs Data, MLOps / LLMOps et Cloud DevOps de l'équipe.
Vous rejoindrez l'équipe produit « IA Factory » (en construction), composée d'un leader produit, de 2 ingénieurs MLOps / LLMOps (dont la personne recrutée) et de plusieurs ingénieurs cloud DevOps.
Votre rôle :
Vous serez en charge des activités suivantes :
* Participer à la définition des spécifications, à l'implémentation et au maintien en condition opérationnelle des produits, services ou procédés développés et maintenus par l'équipe
* Participer à la spécification, à l'implémentation et au maintien en condition opérationnelle du socle IA Factory (clusters kube, Moteurs d'inférence, Observabilité spécifique, Gouvernance & Sécurité)
* Intervenir sur les phases de mise en production d'un LLM (évaluation, fine-tune, déploiement, suivi des performances du modèle)
* Participer à l'amélioration continue des pratiques DevOps et MLOps / LLMOps
* Documenter les processus et assurer la conformité avec les normes de sécurité et de qualité
* Surveiller les performances des modèles en production (drift, latence, précision)
* Participer à la construction de l'équipe produit « IA Factory »
* S'informer des avancées techniques dans le domaine de l'intelligence artificielle, mais aussi proposer des approches novatrices permettant de répondre aux besoins pris en charge par l'équipe IA Factory.
L'équipe produit « IA Factory » travaille en conformité avec les principes de l'agilité. Notre mode de fonctionnement sera, à terme, orienté par les principes SAFe.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.