Ce stage est à pourvoir à Roubaix pour 6 mois. Au sein de votre équipe OneTeam - Vous intégrez la Squad Data Factory, l'équipe chargée de collecter et transformer les données pour piloter les décisions de l'entreprise (Modèles, Datasets, Dashboards). OVHcloud possède un historique data de plus de 10 ans et une quantité impressionnante de pipelines. Le défi actuel est de maîtriser cette complexité : passer d'une documentation partielle et en partie manuelle à une génération exhaustive et automatisée. Vos principales responsabilités Votre mission est de construire un système capable d'analyser le code de nos pipelines pour générer automatiquement une documentation toujours à jour, en s'appuyant sur les technologies d'IA d'OVHcloud. Vos missions consisteront à : - Développement & IA : Concevoir un moteur de génération de documentation basé sur des LLMs capable de "lire" le code des pipelines existants. - Granularité & Lineage : Faire évoluer le catalogue de données (Datahub) pour descendre à une précision fine : comprendre d'où vient et comment est calculée chaque colonne de chaque dataset et chaque item de dashboard (au-delà du simple lien entre datasets). - Automatisation : Mettre en place les processus pour que cette documentation se mette à jour en permanence sans intervention humaine. Votre futur impact Dans 6 mois - Dans 4 à 6 mois Vous aurez déployé un système autonome qui garanti la conformité de l'information data. Grâce à vous, n'importe quel collaborateur pourra consulter le catalogue Datahub et comprendre instantanément l'origine et le calcul d'une donnée précise. C
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.