Responsable de la conception globale d'une plateforme d'analyse de documents multimodaux et d'extraction de données structurées, couvrant l'analyse complexe de la mise en page des PDF et des documents numérisés, l'extraction sémantique, la reconstruction structurelle, la validation de la qualité et l'intégration métier.
Pilote la stratégie de modélisation multimodale (vision, langage et mise en page) et la collaboration multi-agents (décomposition des tâches, vérification, résolution des conflits, boucles de rétroaction), et planifie les formations personnalisées et l'optimisation continue.
🎯 Principales responsabilités
1. Concevoir et itérer le pipeline d'analyse de documents multimodaux : modélisation de la mise en page et de la structure, extraction sémantique, alignement intermodal et reconstruction structurelle.
2. Développer et optimiser les mécanismes de collaboration multi-agents : décomposition des tâches, planification parallèle/séquentielle, revue par les pairs et amélioration continue de la qualité.
3. Définir les stratégies de sélection, de combinaison et de routage des modèles (distribution dynamique selon le type de document, la structure du contenu et les indicateurs de qualité).
4. Planifier et exécuter la validation du modèle, l'adaptation au domaine, l'apprentissage continu, l'apprentissage actif et les boucles de rétroaction des données.
5. Établir des indicateurs de bout en bout : précision d'extraction, cohérence structurelle, efficacité de la collaboration entre agents, latence, stabilité et coût.
🎓 Qualifications requises
* Formation : Master ou diplôme supérieur dans un domaine STIM pertinent (statistiques, informatique, mathématiques, science des données, etc.).
🧩 Expérience :
* Plus de 5 ans d'expérience pratique en apprentissage automatique/science des données.
* Expérience pratique de l'orchestration d'agents (ou de sous-processus modulaires) dans des flux de travail de production.
🛠️ Compétences :
* Solides connaissances fondamentales en apprentissage automatique et en apprentissage profond ; représentations multimodales et approches d'alignement intermodal.
* Compréhension approfondie des principes fondamentaux et des algorithmes courants pour les grands modèles multimodaux : attention intermodale et alignement de représentations, fusion d'embeddings vision/texte, modélisation de la structure hiérarchique et de la mise en page, paradigmes d'apprentissage par instruction et par contraste, mécanismes d'augmentation du contexte long et de la récupération, évaluation et analyse des modes de défaillance.
* Connaissance des modèles de collaboration multi-agents : répartition des rôles, routage des tâches, boucles de rétroaction et contrôles de redondance.
* Solides compétences en analyse statistique et conception expérimentale : tests d’hypothèses, plans factoriels, analyse de puissance, tests A/B et évaluation multivariée.
* Capacité à décomposer des problèmes complexes et à optimiser les performances grâce à des indicateurs clés de performance.
* Rigueur dans l’analyse de la qualité des données et des erreurs ; capacité à identifier rapidement les goulots d’étranglement du système.
* Excellentes aptitudes à la communication et à la collaboration interfonctionnelle.
* Outils et pratiques : expérience en modélisation multimodale, évaluation et suivi de modèles, automatisation des expériences, traitement des données et déploiement orienté services (aucun framework spécifique requis).
* Maîtrise de la programmation Python et des frameworks de développement multi-agents courants : par exemple, ADK, LangGraph, AutoGen
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.