Lieu du stage : Biot (06)
Sujet : Methodes de machine learning pour l'imputation de donnees medicales longitudinales
Au sein de l’équipe Living Twins for Practitioners du département Corporate Strategy & Research, vous rejoindrez un groupe multidisciplinaire réunissant des expertises en mathématiques et informatique appliquée à la médecine et à la biologie. Cette unité pilote des projets innovants dans les domaines de l’oncologie, la neurologie et la cardiologie.
Dans le cadre de l’expansion de nos activités en santé, vous intégrerez l’équipe "Clinical Decision" et serez en charge de la mise en œuvre de méthodes avancées combinant machine learning et statistiques, visant à améliorer la prise de décision clinique, permettant :
* D’analyser un jeu de données réels comportant des données longitudinales
* D’imputer à l’aide de méthodes de machine learning ces données en prenant en compte leur aspect longitudinal
* D’évaluer sur ces données la robustesse et l’apport en performance sur un modèle prédictif des méthodes d’imputation qui seront mises en place.
Vos missions
Le but de ce stage sera de mettre en place une méthodologie d’analyse et d’imputation de données longitudinales, à partir de données médicales récoltées au cours du temps.
En pratique clinique, l’analyse de données longitudinales implique la collecte de mesures répétées d’individus au fil du temps du temps (e.g. des données cliniques, des données biologiques). Ces données, souvent manquantes et mesurées de manière irrégulière, impliquent alors de nombreux challenges lors de l’analyse et de l’entraînement de modèles prédictifs. En raison de la corrélation inhérente entre les observations provenant d'un même participant, il est essentiel d'utiliser des méthodes analytiques qui tiennent compte de la trajectoire individuelle et temporelle.
L’enjeux de ce stage sera donc de mettre en place une approche permettant d’analyser un jeu de données longitudinal en prenant en compte ses aspects individuels et temporels, afin d’avoir une bonne compréhension des mécanismes sous-jacent ; puis de mettre en place une méthode d’imputation longitudinale afin d'obtenir un ensemble de données complet. La méthodologie sera évaluée pour mesurer sa robustesse, ses performances et son impact sur les modèles prédictifs appliqués au jeu de données imputé.
Votre mission consistera à :
* Effectuer un état de l’art des méthodes d’analyse et d’imputation dans le cadre de données longitudinales ;
* Prendre en main la base de données de patients ;
* Implémenter des méthodes d’analyse et un algorithme permettant l’imputation d’un jeu de données longitudinales de patients ;
* Comparer la nouvelle méthodologie développée avec les méthodes existantes dans la littérature ;
* Effectuer une synthèse des résultats obtenus.
Vos qualifications
Actuellement en Master 2 / Bac+5 en Ecole d’ingénieur ou Université, avec une spécialisation en Mathématiques Appliquées ou Statistiques.
Vous possédez :
* De bonnes compétences en programmation Python
* De bonnes compétences en Machine Learning, mathématiques et statistiques
De nature rigoureuse et autonome, vous aimez travailler en équipe et contribuer à des projets collectifs. Vous faites preuve d’esprit critique, d’initiative et disposez d’un bon sens de la communication.
Vous êtes à l’aise pour communiquer en anglais dans un contexte international, à l’oral comme à l’écrit.
Des connaissances en biologie et/ou en médecine seraient un plus.
Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans
Principaux avantages et bénéfices :
* Environnement multiculturel
* Cadre de travail convivial axé sur le bien-être et la santé
* Engagement en faveur de la diversité et de l’inclusion
* Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.