Fondé en 1961 et situé à Nice, le Centre Antoine Lacassagne est un des 18 Centres de Lutte Contre le Cancer français, membre du Groupe UNICANCER.
Etablissement de santé de droit privé à but non lucratif et reconnu d’utilité publique (statut ESPIC - Etablissement de Santé Privé d’Intérêt Collectif), le Centre Antoine Lacassagne remplit des missions de service public en cancérologie :
* Soins : prévention, dépistage, traitement et réinsertion
* Recherche : fondamentale, translationnelle, clinique
* Enseignement : universitaire et post-universitaire
Avec 197 lits et places et 843 salariés, le Centre Antoine Lacassagne prend en charge tous les types de cancer et traite une file active de plus de 6000 patients par an. Institut de référence en cancérologie, il ambitionne de faire bénéficier à tous les patients des innovations qui vont révolutionner la médecine de demain : médecine personnalisée, immunothérapie, protonthérapie, etc., tout en garantissant un haut niveau de qualité de prise en charge.
Les missions qui vous attendent :
Au sein du Département d'Epidemiologie, de Biostatistique et des Données de Santé, en tant que Data Engineer, vous serez responsable de créer les pipelines de flux de données (structurées et non structurées) vers l'entrepôt de données de santé en construction au Centre Antoine Lacassagne. Vous collaborerez étroitement avec les équipes de data management, data science et informatique (infrastructure, sécurité et opérations).
Vos principaux objectifs seront de développer, maintenir et améliorer les solutions et infrastructures data nécessaires à la collecte, la centralisation, le stockage et l’accès aux données de santé collectées au sein du Centre.
Vous travaillerez principalement sur des données de santé de vie réelle, générées lors des soins routiniers pour les patients du CAL. Ces données proviennent de multiples sources : dossier patient informatisé (DPI), logiciels de prise en charge (pharmacie, imagerie, anatomopathologie, oncopharmacologie, chirurgie, oncologie), informations pour le remboursement, registres ou cohortes, réseaux sociaux, objets connectés, etc.
Vos missions principales :
* Concevoir et maintenir des flux d’intégration (collecte, ingestion, stockage) pour centraliser les données dans un entrepôt tout en assurant leur qualité.
* Mettre en place des pipelines de données sécurisées, traitées et nettoyées par les data managers, pour fournir des bases « gelées » aux experts scientifiques, biostatisticiens et data scientists.
* Automatiser la validation de la qualité des données intégrées dans l'Entrepôt de Données de Santé, en confrontation avec les données issues de collecte manuelle.
* Assister les data scientists dans la structuration de données non structurées issues de comptes-rendus médicaux ou documents du DPI, en utilisant des solutions de NLP.
* Rédiger et partager la documentation (procédures, guides, référentiels) et participer au dépôt du dossier de l'EDS.
* Communiquer et collaborer avec les responsables de projets, assurer le reporting aux managers et à la direction.
Profil idéal :
* Diplôme d'ingénieur en informatique ou équivalent (bac+5 minimum)
* Connaissances en SQL, Python (Pandas, Numpy, ...), PL/SQL (option)
* Bases relationnelles
* Connaissance des données médicales
* Bonne compréhension du cycle de vie de la donnée et de la confidentialité
* Capacité à réconcilier des sources de données hétérogènes
* Notions en FHIR, OMOP, OSIRIS RWD seraient un plus
Si vous vous reconnaissez dans ce poste de Data Engineer, envoyez votre candidature et contribuons ensemble à faire avancer la vie !
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.