Description du poste
Au sein de l’équipe Analyse et Usage des Données, votre mission consiste à analyser, structurer et valoriser les données de santé afin d’en garantir la qualité, la fiabilité et l’exploitabilité, au service de projets à fort impact scientifique et médical.
Vous jouez un rôle clé dans la qualification, l’intégration et la valorisation des données de santé issues des logiciels de soin du Système d’Information de l’AP-HP, au service de la recherche, de l’innovation médicale et de l’appui au soin.
MISSIONS GÉNÉRALES
Vous aurez la charge de la qualification et de l’accompagnement de l’intégration des données de santé dans l’EDS, notamment des données d’oncologie. Ces données, à très forte valeur ajoutée, sont particulièrement attendues par la communauté médicale et constitueront le socle d’une offre de service data et d’intelligence artificielle à développer.
Dans ce cadre, vous missions seront les suivantes :
· Analyser et évaluer la qualité des données santé issues des logiciels de soin et de recherche
· Qualifier, normaliser, tracer et structurer les données en vue de leur intégration et de leur réutilisation
· Définir les besoins de transformation, d’enrichissement et d’annotation pour répondre aux usages de recherche, de pilotage et d’appui au soin
· Mettre en place des plans de tests et des contrôles qualité adaptés aux données de santé
· Accompagner les utilisateurs dans la compréhension et l’usage des données, en lien avec les contextes cliniques et scientifiques
· Documenter les données ainsi que leur cycle de vie au sein des outils de documentation et du catalogue de métadonnées de l’EDS.
· Contribuer à la mise en œuvre des bonnes pratiques de gouvernance, dans le respect des exigences réglementaires, éthiques et de sécurité
MISSIONS PONCTUELLES OU SPÉCIFIQUES
Dans le cadre du programme PSCC Data, vous serez amené à accompagner un médecin référent dans des activités de revue et d'annotation de documents médicaux, en vue de contribuer à la structuration d'un modèle de données dédié à la cancérologie. Ces travaux combinent expertise clinique et compétences analytiques pour soutenir la qualification et l’organisation les données issues de ce domaine.
Les tâches d'annotation incluront notamment :
· Lecture et revue de comptes rendus médicaux en lien avec des parcours de soins oncologiques
· Identification et annotation d'entités cliniques pertinentes : diagnostics, stades tumoraux (TNM), types histologiques, traitements reçus (chimiothérapie, radiothérapie, chirurgie), dates clés du parcours
· Contribution à la définition du schéma d'annotation : participation aux ateliers de cadrage pour préciser les concepts à capturer et les règles d'annotation
· Documentation du modèle de données : contribution au catalogue de métadonnées dédié à la cancérologie
Le ou la Data Analyst dont la présente fiche de poste fait l’objet contribue au quotidien au programme PSCC AP-HP.
Diplôme : ingénieur ou Master 2 en sciences de l’informatique, sciences des données, bioinformatique ou statistiques
Niveau d’étude : Bac+5
Niveau d’expérience : 3 à 5 ans d’expérience
Compétences :
• Bonnes connaissances des langages d’analyse de données Python, R, SQL
• Bonnes Connaissances en apprentissage statistique, machine learning, deep learning et évaluation de modèles.
• Bonnes Connaissances des enjeux de déploiement, d’industrialisation et de suivi des modèles IA (pipelines de données, APIs, MLOps).
• Connaissances des outils de visualisation de données (Exemples : Grafana, Superset, Tableau, Power BI, …)
• Connaissances des frameworks de tests sur données (DBT, Great Expectations, Pandera, …)
• Connaissances en bases de données et des technologies du Big Data (NoSQL, SQL, Hadoop, S3, …)
• Compréhension des scripts d’automatisation et des pipelines de données
Prérequis :
• Expérience dans le domaine de la donnée, dans le domaine médical en lien avec l’oncologie.
• Maîtrise de l’anglais indispensable (écrit et oral)
Savoir-faire et savoir être :
• Rigueur et organisation
• Bonne capacité d’analyse et d’écoute
• Sens du relationnel, pédagogie et qualités de communicant
• Capacité d’adaptation
• Force de proposition
• Gestion du temps et des priorités
• Déontologie, Respect du secret professionnel
Profil recherché
Diplôme : ingénieur ou Master 2 en sciences de l’informatique, sciences des données, bioinformatique ou statistiques
Niveau d’étude : Bac+5
Niveau d’expérience : 3 à 5 ans d’expérience
Compétences :
• Bonnes connaissances des langages d’analyse de données Python, R, SQL
• Bonnes Connaissances en apprentissage statistique, machine learning, deep learning et évaluation de modèles.
• Bonnes Connaissances des enjeux de déploiement, d’industrialisation et de suivi des modèles IA (pipelines de données, APIs, MLOps).
• Connaissances des outils de visualisation de données (Exemples : Grafana, Superset, Tableau, Power BI, …)
• Connaissances des frameworks de tests sur données (DBT, Great Expectations, Pandera, …)
• Connaissances en bases de données et des technologies du Big Data (NoSQL, SQL, Hadoop, S3, …)
• Compréhension des scripts d’automatisation et des pipelines de données
Prérequis :
• Expérience dans le domaine de la donnée, dans le domaine médical en lien avec l’oncologie.
• Maîtrise de l’anglais indispensable (écrit et oral)
Savoir-faire et savoir être :
• Rigueur et organisation
• Bonne capacité d’analyse et d’écoute
• Sens du relationnel, pédagogie et qualités de communicant
• Capacité d’adaptation
• Force de proposition
• Gestion du temps et des priorités
• Déontologie, Respect du secret professionnel
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.