Nous recherchons un Data Engineer spécialisé Informatica et PySpark pour rejoindre une équipe dynamique en charge du développement et de la gestion d?un datalake d?envergure. La mission consiste à accompagner la migration des workflows Informatica vers des solutions PySpark, tout en assurant la maintenance, l?évolution et la modernisation de la plateforme de données.
Le poste est basé sur une infrastructure Cloudera Hadoop on-premise (pas de cloud) et demande un fort esprit développeur Python pour la refonte des pipelines ETL.
Contexte et objectifsLa mission s?inscrit au sein d?une équipe Big Data & API en charge d?un datalake utilisé comme plateforme centrale de données par les équipes IT et métiers.
Le Data Engineer sera en charge de :
La gestion quotidienne de la production et de la dette technique
La révision de l?architecture existante et la proposition d?évolutions
Le développement et la maintenance des pipelines et workflows de données
La migration des workflows Informatica vers des solutions PySpark modernes et industrielles
Profil candidat:
Expérience confirmée en développement ETL, notamment sur Informatica et Spark/PySpark
Capacité à évoluer dans un environnement Big Data complexe et à forte volumétrie
Bon sens de la communication et collaboration avec les équipes métiers et IT
Autonome, rigoureux et force de proposition
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.