Description du poste Contexte Acteur majeur disposant de fonds documentaires riches et volumineux (codes, jurisprudence, revues, actualités…), nous développons une plateforme d’Intelligence Artificielle destinée à des professionnels exigeants. L’Architecte Plateforme IA joue un rôle clé dans la conception, la mise à l’échelle et l’exploitation d’infrastructures permettant de délivrer des services IA performants, sécurisés et fiables. Mission principale Concevoir et industrialiser la plateforme IA en assurant la transformation de données complexes en services intelligents, performants et sécurisés, tout en garantissant leur scalabilité et leur conformité réglementaire. Responsabilités 1. Architecture & Plateforme IA Concevoir l’architecture globale des services IA (LLMOps). Orchestrer les modèles et les pipelines de traitement. Définir et mettre en œuvre des architectures RAG adaptées aux cas d’usage (Advanced, Graph, Agentic). Concevoir et optimiser les bases vectorielles (Vector DB). Gérer le cycle de vie des prompts et le fine-tuning de modèles spécialisés. 2. Industrialisation & MLOps Mettre en place des pipelines automatisés de déploiement et de monitoring. Industrialiser les workflows ML (MLflow, Kubeflow, Airflow, DVC…). Optimiser les coûts d’inférence (gestion des tokens, choix des modèles). Assurer la qualité et la robustesse des modèles en production. 3. Infrastructure & Scalabilité Piloter l’infrastructure Cloud et Kubernetes. Garantir la montée en charge et la haute disponibilité des services. Optimiser l’utilisation des ressources (CPU/GPU). Améliorer les performances globales de la plateforme. 4. Qualité & Fiabilité des réponses Mettre en place des mécanismes de : mesure de pertinence, réduction des hallucinations, re-ranking des résultats. Assurer la traçabilité des sources dans les réponses générées. 5. Sécurité, conformité & gouvernance Intégrer une approche “confidentialité by design”. Garantir la protection des données sensibles. Assurer la conformité aux réglementations (RGPD, AI Act). Contribuer aux enjeux de souveraineté des données. Profil recherché Profil recherché Compétences techniques MLOps & outils MLflow, Kubeflow, DVC, Airflow Niveau : Confirmé Bases de données SQL, document, graph, vector databases (Elasticsearch, OpenSearch, Weaviate) Niveau : Expert Cloud & infrastructure AWS, Azure ou GCP Terraform, Ansible Niveau : Confirmé IA & frameworks Langchain, LlamaIndex Niveau : Expert Conteneurisation Docker, Kubernetes Niveau : Confirmé Data & Machine Learning Python, Spark PyTorch, TensorFlow, Scikit-learn NVIDIA, Triton Niveau : Expert
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.