Description Du Poste
En intégrant le Data & IA Hub SOCOTEC, vous apporterez votre expertise technique pour :
* Concevoir, développer et maintenir des flux de données robustes et évolutifs
* Établir et promouvoir des standards de qualité pour la documentation et la validation des flux de données, garantissant ainsi leur fiabilité et leur traçabilité.
* Participer activement aux processus de qualification technique, en évaluant de nouvelles technologies et en recommandant leur adoption lorsqu'elles apportent une valeur ajoutée à notre écosystème data.
* Assurer une veille technologique continue sur les différentes solutions Cloud,
* Jouer un rôle clé dans l'évolution de notre architecture data, en identifiant les opportunités d'amélioration et en proposant des solutions techniques avancées pour répondre aux défis actuels et futurs de l'entreprise.
* Collaborer étroitement avec les équipes BI et Data Science pour assurer une intégration harmonieuse des flux de données dans les projets ciblés.
Vous travaillerez sur deux missions principales :
* Au sein de l’entité Socotec Monitoring France (20%), vous participerez à la définition de la stratégie optimale de données pour Socotec Monitoring (structuration, processus, open data, achats de données externes)
* Pour le compte du groupe Socotec (80%), vous participez à la construction du Data Lake à l’échelle mondiale. Votre objectif sera de développer les flux de données pour leur analyse en lien avec les équipes BI et Data Science. Vous apprendrez à organiser et ordonnancer les flux d’extraction, de transformation et de chargement des données en garantissant leur fiabilité, leur disponibilité, etc.
Gestion d'une équipe de 3 Data Engineers
Le stack technique utilisé :
* Databricks Cloud (AWS)
* Fivetran pour l’intégration de données
* Spark/Pyspark pour les pipelines ETL
* Github/Gitlab pour versionner les sources
* DeltaLake/Iceberg pour le stockage de données
* AWS (S3, Lambdas)
* Power BI, l’outil de BI, géré avec les équipes BI
Chez SOCOTEC, les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique, management d’une équipe (lead data), etc.
Le télétravail est possible à 100% avec une journée de présence par mois sur site obligatoire.
Vous aurez la possibilité d’interagir à l’international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles.
Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de votre code.
Qualifications
* Master en Big Data ou diplôme d'ingénieur en informatique avec une forte appétence pour la data
* Expérience avérée avec Databricks et son écosystème (DeltaLake, Spark)
* Solide expérience dans au moins une plateforme cloud majeure (AWS, GCP ou Azure)
* Connaissances des principes de l’architecture Modern Data Stack
* Expérience dans la mise en place et la gestion de pipelines de données complexes
* Maîtrise des bases de données SQL et NoSQL, ainsi que des concepts associés
* Expérience avec les outils collaboratifs de développement (Git, GitLab, Jupyter Notebooks, etc.)
* Intérêt marqué pour les technologies innovantes
* Esprit d'équipe
* Anglais courant, y compris un bon niveau technique
Lieu : Levallois-Perret, Île-de-France, France
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.