* L’équipe AI / GenAI for Opex de l'IA Factory d'AXA France conçoit et déploie des solutions d’intelligence artificielle à fort impact opérationnel pour l’ensemble des directions métiers (Assurance, Sinistres, Finance, Juridique, Opérations, etc.). Elle intervient sur des projets de Document Understanding à grande échelle, avec un objectif clair : automatiser, fiabiliser et accélérer le traitement des documents métiers, tout en garantissant robustesse, sécurité et passage à l’échelle industrielle. Vous intégrerez une équipe de 12 personnes, composée de : Machine Learning Engineers, Data Scientists, Leads Data Scientist & Lead ML Engineer (encadrement technique). En tant que stagiaire Data Scientist / Machine Learning Engineer, vous contribuerez à l’ensemble du cycle de vie d’applications IA, depuis les données jusqu’au déploiement en production. Les missions pourront être ajustées selon votre dominante (Data Science ou ML Engineering), tout en conservant une vision end-to-end. Vos missions seront les suivantes : 1. Acquisition & prétraitement des données Collecte et nettoyage de documents scannés (PDF, images) Extraction du texte et de la structure via des modèles OCR Enrichissement sémantique via NER Constitution de corpus annotés de haute qualité Technos : LayoutLMv3, TrOCR, Tesseract OCR 5, VLMs, spaCy 2. Modélisation & fine-tuning Fine-tuning de LLMs via LoRA / QLoRA Adaptation de SLMs / TLMs pour des tâches NLP ciblées Évaluation des performances (BLEU, ROUGE, F1, OCR accuracy) Spécialisation de modèles sur des cas métiers AXA Technos : Hugging Face Transformers, PEFT, LoRA 3. Pipelines & orchestration Construction de pipelines ETL & Feature Engineering Intégration des modèles dans des APIs REST Garantie de la reproductibilité et de la traçabilité Technos : Kedro, FastAPI, Docker 4. Entraînement & optimisation Entraînement des modèles sur Azure ML / OpenShift AI Hyperparameter tuning (Optuna, Ray Tune) Arbitrage performance / coûts 5. Déploiement & MLOps Containerisation des modèles Déploiement sur Kubernetes via Helm / Kustomize Mise en place de pipelines CI/CD Sécurisation, scalabilité et robustesse des services Technos : Docker, Kubernetes, Azure DevOps 6. Monitoring & maintenance Suivi de la performance en production Détection de dérives (concept drift, latence, erreurs) Automatisation du retraining Technos : OpenTelemetry, Dynatrace, Azure ML Pipelines 7. Collaboration & documentation Code reviews, pair programming Documentation technique et MLOps Outils : Markdown, MkDocs, Confluence Qualifications : Vous êtes étudiant en Master 2 ou dernière année de cycle d'ingénieur spécialisé en Data Science, Statistiques, Mathématiques appliquées, Informatique, IA. Vous recherchez un stage de fin d'études (PFE) de 6 mois à partir de février / avril 2026. Compétences techniques : Programmation · Python (pandas, numpy, PyTorch) Machine Learning & NLP · Classification, régression, clustering · Transformers & LLMs (BERT, GPT, LLaMA, T5) · OCR & Document AI (spaCy, Tesseract, LayoutLM, TrOCR) MLOps & Cloud · Git & bonnes pratiques de code · Pipelines ML · Microservices · Docker, Kubernetes, Helm, Kustomize · Expérience Cloud (Azure apprécié) Soft skills : · Autonomie et curiosité intellectuelle · Esprit d'équipe et collaboration · Capacité de vulgarisation technique · Communication claire (écrit / oral) La motivation, la capacité d'apprentissage et la rigueur sont essentielles. Rejoignez-nous et contribuez à améliorer les processus de demain grâce à l'intelligence artificielle !
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.