RESPONSABILITÉS :
Missions :
L'ingénieur data est un développeur informatique dont la principale mission est de mettre en place la collecte de données brutes, c'est-à-dire la matière première de son activité, en vue de transformer ces données pour que les différentes équipes de l'entreprise, notamment les Data Scientists et les Data Analysts, puissent les exploiter et les analyser. Il veille également au stockage des données dans un Data Warehouse, qu'il va concevoir et construire pour rendre les données exploitables par les analystes.
Activités principales :
Le registre des AVC du Pays de Brest est un registre populationnel (labellisé INSERM et Santé Publique France) qui constitue l'un des registres les plus grands d'Europe avec plus de 14 000 patients collectés et environ 350 variables par patient en lien avec le service de Neurologie dirigé par le Pr TIMSIT, le centre d'investigation clinique (CIC), la Direction de la recherche et de l'innovation (DRCI) au CHU de Brest et le Centre de données cliniques (CDC). Dans ce projet, un travail d'amélioration de la qualité des données et un enrichissement par des données supplémentaires biologiques et d'imagerie sera à réaliser. La personne recrutée travaillera en étroite collaboration avec des chercheurs, des praticiens, ainsi que des data engineers. Ce poste permet de contribuer directement à des projets de recherche à fort impact financé par des fonds européens pour améliorer la prise en charge et les soins des patients atteints d'un AVC.
L'unité INSERM-1078 est une unité de recherche (GGB Génétique, génomique fonctionnelle et biotechnologies) qui comprends des compétences multiples en épidémiologie, statistique et génétique. A terme le projet est d'intégrer des données cliniques, radiologiques, biologiques et multi-omiques.
PROFIL RECHERCHÉ :
Expérience souhaitée de 2 à 3 ans dans le domaine
De formation Bac+ 5 en data engineering
Compétences souhaitées :
Techniques :
● Maîtrise de Python pour le traitement et l'automatisation des données
● Maîtrise des bases de données relationnelles (SQL) et notions NoSQL
● Maîtrise de Git pour le versioning, la traçabilité et la gestion collaborative du code
● Développement de pipelines de données robustes et testés
● Mise en place de contrôles de qualité des données (validation, complétude, cohérence, détection d'anomalies)
● Bonne compréhension des architectures data sur infrastructure locale
● Expérience en modélisation de données (data warehouse, data marts)
● Capacité à traiter des volumes importants de données
● Connaissance des standards de santé (ex. : DICOM) est un plus.
● Maîtrise des contraintes de sécurité et de confidentialité des données de santé (RGPD, accès restreint, traçabilité) est un plus.
Transverses :
● Rigueur dans le traitement des données critiques
● Capacité à structurer des données complexes
● Esprit analytique et résolution de problèmes
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.