Nous recherchons un(e) Lead Data Engineering / Architecte Data pour piloter la modernisation de notre infrastructure data et la transformation vers une architecture data lakehouse.
Mission principale
Pilier technique de notre plateforme de données, vous dirigerez la migration de notre infrastructure NoSQL vers une architecture data lakehouse avec découplage stockage/calcul, tout en optimisant nos pipelines de traitement massif et en garantissant la scalabilité.
Responsabilités
- Définir et piloter l'architecture data de la plateforme
- Diriger la migration NoSQL vers data lakehouse (stockage/calcul découplé)
- Concevoir et optimiser les pipelines ETL/ELT à grande échelle
- Encadrer l'équipe data engineering et garantir la qualité
- Optimiser les jobs Spark pour données IoT massives
- Implémenter l'observabilité et les SLAs de qualité des données
- Optimiser les coûts de stockage et calcul sur Azure
Stack Technique
- Data Lakehouse: Parquet/ORC, Azure Data Lake Gen2, solutions de catalogage
- Processing: Apache Spark (Scala/Python), PySpark
- Query Engines: Trino/Presto, JDBC/ODBC Gateways, Spark SQL
- Orchestration: Airflow, GitLab CI, Kubernetes/AKS
- Cloud: Azure, Terraform, Docker
- Monitoring: OpenTelemetry, Prometheus/Grafana, Azure Monitor
Profil recherché
Compétences Techniques Indispensables :
- Expertise Apache Spark (Scala ou Python)
- Expérience architectures data lakehouse (Iceberg, Delta Lake, Hudi)
- Connaissance bases NoSQL distribuées (Cassandra, ScyllaDB, HBase)
- Maîtrise formats columnaires (Parquet, ORC) et stockage
- Conception pipelines ETL/ELT à grande échelle
- Python, Cloud Azure, moteurs SQL distribués
Fortement appréciées
- Migrations NoSQL vers data lakehouse
- Séries temporelles et données IoT
- Orchestration (Airflow, Prefect), Scala, Terraform
- Optimisation coûts cloud, data quality
Soft Skills
- Leadership technique et capacité à fédérer
- Communication et pédagogie
- Autonomie, rigueur, pragmatisme
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.