Ce stage est à pourvoir pour une durée de 6 mois à partir du mois de septembre 2026.
Au sein de votre équipe #OneTeam
* Vous rejoindrez l'unité PU.Platform / Squad Cloud Native Services, dont la mission est de fournir des services cloud natifs managés.
* En tant que stagiaire Ingénieur AI Ops dans cette équipe, vous participerez à la conception et au prototypage d'une plateforme d'assistance IA pour la gestion des incidents en production. Plus précisément, vous contribuerez à l'automatisation de la détection d'anomalies et à l'aide au diagnostic grâce aux modèles de langage.
Vos principales responsabilités
* Implémenter des pipelines pour agréger logs, métriques, traces et événements applicatifs.
*
Développer des algorithmes de corrélation et de détection d'anomalies.
* Intégrer des modèles de langage (LLM) pour résumer les incidents et suggérer des causes racines.
*
Tester la solution en environnement de staging et documenter les résultats obtenus.
Votre futur impact
Dans 6 mois vous aurez développé des compétences dans :
* La mise en place de pipelines de données à grande échelle.
* Le déploiement et le suivi de modèles de Machine Learning en production.
* L'application concrète des LLM (RAG, optimisation de prompts) au domaine technique.
* L'utilisation d'outils d'Infrastructure as Code comme Terraform ou Ansible.
* La gestion d'incidents via la création de runbooks et le debugging.
C
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.