Informations sur le poste
Intitulé de l'offre
Alternant.e Data Engineer H/F
Filière MGEN + Métier ou Fonction
Systèmes d'information - Alternant niv 7/8
Type de contrat
Alternance
Durée du CDD ou stage/alternance en mois
24
Présentation du Site ou de la Direction
MGEN Technologies, DSI du Groupe MGEN compte un peu plus de 500 collaborateurs répartis sur 3 sites (Paris, Tours, Nancy).
Le Département SI Data porte la réalisation de la stratégie « data centric » de l’entreprise. Au cœur de la transformation engagée du SI, sa mission transverse garantit l’adéquation des plateformes Data & Référentiels pour valoriser l’usage de la
data dans une approche « Data as a product ».
Au sein de la Data Platform, vous interviendrez sur les outils :
1. Semarchy xDI (intégration de données)
2. Greenplum (base de données analytique)
3. OpenMetadata (catalogue de données)
Dans un contexte de structuration de la gouvernance data, l’objectif est d’améliorer :
4. la documentation des données et des flux
5. la qualité et la fiabilité des pipelines
6. les performances des traitements
Missions confiées
1. Mise en place d’une documentation automatique des données
7. Extraire les métadonnées depuis Greenplum (tables, colonnes, volumétrie)
8. Concevoir un générateur de documentation (Markdown / HTML)
9. Produire un dictionnaire de données lisible et maintenable
10. Mettre à jour automatiquement la documentation
2. Documentation des pipelines data (XDI)
11. Analyser les flux développés dans Semarchy xDI
12. Extraire les informations clés des pipelines (sources, cibles, transformations)
13. Reconstituer un lineage simplifié des données : source → staging → datamart
14. Générer une documentation standardisée des flux
3. Enrichissement automatisé (IA encadrée)
15. Générer des descriptions automatiques de tables et pipelines
16. Résumer des transformations SQL en langage compréhensible
17. Améliorer la lisibilité de la documentation (validation humaine requise)
4. Mise en place de contrôles qualité (option selon avancement)
18. Définir des règles de qualité des données :
complétude, cohérence, unicité
19. Implémenter des tests automatisés sur les pipelines
20. Produire un reporting des anomalies
5. Optimisation des performances
21. Analyser les requêtes SQL dans Greenplum
22. Optimiser : indexation, partitionnement, distribution des données
23. Mesurer les gains de performance et formaliser les bonnes pratiques
6. Contribution au Data Catalog
24. Alimenter OpenMetadata : descriptions de tables documentation des flux, liens entre données et pipelines
25. Participer à la structuration de la gouvernance data
Livrables attendus
26. Scripts d’extraction des métadonnées (BDD & pipelines)
27. Générateur de documentation automatique
28. Documentation des données et des flux
29. Optimisations SQL documentées
30. Guide d’utilisation et bonnes pratiques
Profil recherché
Vous préparez une formation de niveau Bac+3 à Bac+5 en Informatique, Data, Statistiques ou dans un domaine équivalent.
Vous êtes reconnu(e) pour :
31. Votre rigueur et votre sens du détail,
32. Votre esprit d’analyse et votre capacité à résoudre des problématiques complexes,
33. Votre capacité à structurer, documenter et fiabiliser vos travaux,
34. Votre curiosité pour les sujets liés à la data et à l’intelligence artificielle,
35. Votre capacité à travailler en équipe et à collaborer avec différents interlocuteurs.
36. Vous disposez de bonnes bases en SQL et possédez idéalement des connaissances en data engineering (ETL, pipelines de données).
Des notions en Python ou dans un langage de scripting constitueraient un atout supplémentaire.
Si vous souhaitez développer vos compétences dans les domaines de la data, de l’automatisation et de l’exploitation des données, alors cette alternance est faite pour vous !
Le groupe MGEN s’engage pour la Diversité et le Handicap et garantit l’égalité des chances. Nos postes sont ouverts à toutes et tous.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.