Description entreprise :
L'Inserm est le seul organisme public français entièrement dédié à la recherche biologique, médicale et en santé des populations. Il dispose de laboratoires de recherche sur l'ensemble du territoire, regroupés en 12 Délégations Régionales. Notre institut réunit 15 000 chercheurs, ingénieurs, techniciens et personnels administratifs, avec un objectif commun : améliorer la santé de tous par le progrès des connaissances sur le vivant et sur les maladies, l'innovation dans les traitements et la recherche en santé publique.
Rejoindre l'Inserm, c'est intégrer un institut engagé pour la parité et l'égalité professionnelle, la diversité et l'accompagnement de ses agents en situation de handicap, dès le recrutement et tout au long de la carrière. Afin de préserver le bien-être au travail, l'Inserm mène une politique active en matière de conditions de travail, reposant notamment sur un juste équilibre entre vie personnelle et vie professionnelle.
L'Inserm a reçu en 2016 le label européen HR Excellence in Research et s'est engagé à faire évoluer ses pratiques de recrutement et d'évaluation des chercheurs.
Description du poste :
Mission principale :
La personne recrutée participera à la structuration, la mise en qualité et la valorisation des données cliniques du département de radiothérapie, en collaboration étroite avec le pôle Data et l'unité de recherche 1355, dans le but de constituer des jeux de données exploitables pour le développement de modèles d'intelligence artificielle de prédiction de la réponse aux traitements.
Activités principales :
· Analyse des sources de données cliniques et techniques liées à la radiothérapie
· Structuration, normalisation et harmonisation des données
· Mise en place de pipelines de traitement automatisés (Python, SQL, outils d'orchestration)
· Contribution à la gouvernance et à la traçabilité des données (qualité, complétude, reproductibilité)
· Conception et application de méthodes de traitement des données manquantes (imputation, filtrage, contrôle de qualité) dans les pipelines de données.
· Collaboration avec les chercheurs de l'unité 1355 pour la préparation des datasets destinés à l'entraînement de modèles IA
· Participation à la documentation technique et méthodologique des flux de données
Profil recherché :
Connaissances :
· Bases solides en informatique, data science et statistiques
· Connaissances en traitement et structuration de données
· Sensibilité aux enjeux liés aux données de santé (confidentialité, qualité, traçabilité)
Savoir-faire :
· Programmation en Python
· Requêtage et manipulation de bases de données (SQL)
· Automatisation de workflows data (RPA, pipelines)
· Mise en place de contrôles qualité et d'indicateurs de complétude des datasets
· Intégration du traitement des données manquantes dans des pipelines de préparation de données
· Capacité à structurer et documenter des jeux de données complexes
Aptitudes :
· Esprit analytique et rigueur scientifique
· Capacité à travailler en équipe pluridisciplinaire
· Autonomie, curiosité et force de proposition
· Bon sens de la communication technique
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.