MGEN. Connaissez-vous MGEN ? • Un employeur de l'ESS qui réconcilie éthique et économie, solidarité et performance • Un acteur majeur en santé et prévoyance avec plus de 4 millions de personnes protégées • 10 000 salariés et 250 métiers diversifiés (assurance, soins, fonctions support, IT…) • Une implantation nationale forte avec plus de 200 sites dont 60 services de soins et d'accompagnement mutualistes • Membre fondateur du Groupe VYV (50 000 collaborateurs), premier groupe de protection sociale mutualiste et solidaire, mobilisé au service du Mieux-vivre. Référence 2026-5579 Date de début de diffusion 10/06/2026 Intitulé de l'offre Alternant.e Data Engineer H/F Filière MGEN Métier ou Fonction Systèmes d'information - Alternant niv 7/8 Type de contrat Alternance Durée du CDD ou stage/alternance en mois 24 Présentation du Site ou de la Direction MGEN Technologies, DSI du Groupe MGEN compte un peu plus de 500 collaborateurs répartis sur 3 sites (Paris, Tours, Nancy). Au sein de la DSI, les plateformes Data & Référentiels sont les fondements sur lesquels les offres MGEN sont construites dans les chaînes de valeurs métiers, en application de la méthodologie S@fe (agilité à l’échelle). Le Département SI Data porte la réalisation de la stratégie « data centric » de l’entreprise. Au cœur de la transformation engagée du SI, sa mission transverse garantit l’adéquation des plateformes Data & Référentiels pour valoriser l’usage de la data dans une approche « Data as a product ». Au sein de la Data Platform, vous interviendrez sur les outils : Semarchy xDI (intégration de données) Greenplum (base de données analytique) OpenMetadata (catalogue de données) Dans un contexte de structuration de la gouvernance data, l’objectif est d’améliorer : la documentation des données et des flux la qualité et la fiabilité des pipelines les performances des traitements Missions confiées 1. Mise en place d’une documentation automatique des données Extraire les métadonnées depuis Greenplum (tables, colonnes, volumétrie) Concevoir un générateur de documentation (Markdown / HTML) Produire un dictionnaire de données lisible et maintenable Mettre à jour automatiquement la documentation 2. Documentation des pipelines data (XDI) Analyser les flux développés dans Semarchy xDI Extraire les informations clés des pipelines (sources, cibles, transformations) Reconstituer un lineage simplifié des données : source → staging → datamart Générer une documentation standardisée des flux 3. Enrichissement automatisé (IA encadrée) Générer des descriptions automatiques de tables et pipelines Résumer des transformations SQL en langage compréhensible Améliorer la lisibilité de la documentation (validation humaine requise) 4. Mise en place de contrôles qualité (option selon avancement) Définir des règles de qualité des données : complétude, cohérence, unicité Implémenter des tests automatisés sur les pipelines Produire un reporting des anomalies 5. Optimisation des performances Analyser les requêtes SQL dans Greenplum Optimiser : indexation, partitionnement, distribution des données Mesurer les gains de performance et formaliser les bonnes pratiques 6. Contribution au Data Catalog Alimenter OpenMetadata : descriptions de tables documentation des flux, liens entre données et pipelines Participer à la structuration de la gouvernance data Livrables attendus Scripts d’extraction des métadonnées (BDD & pipelines) Générateur de documentation automatique Documentation des données et des flux Optimisations SQL documentées Guide d’utilisation et bonnes pratiques Profil recherché Vous préparez une formation de niveau Bac3 à Bac5 en Informatique, Data, Statistiques ou dans un domaine équivalent. Vous êtes reconnu(e) pour : Votre rigueur et votre sens du détail, Votre esprit d’analyse et votre capacité à résoudre des problématiques complexes, Votre capacité à structurer, documenter et fiabiliser vos travaux, Votre curiosité pour les sujets liés à la data et à l’intelligence artificielle, Votre capacité à travailler en équipe et à collaborer avec différents interlocuteurs. Vous disposez de bonnes bases en SQL et possédez idéalement des connaissances en data engineering (ETL, pipelines de données). Des notions en Python ou dans un langage de scripting constitueraient un atout supplémentaire. Si vous souhaitez développer vos compétences dans les domaines de la data, de l’automatisation et de l’exploitation des données, alors cette alternance est faite pour vous ! Le groupe MGEN s’engage pour la Diversité et le Handicap et garantit l’égalité des chances. Nos postes sont ouverts à toutes et tous. Niveau d'expérience Etudiant Localisation du poste Ile-de-France, Paris Ville 3 square Max Hymans
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.