Mission
Malgré l'abondance croissante de données dans l'étude des effets des rayonnements ionisants à faible dose au sein des laboratoires de biologie expérimentale (RNA-seq, métabolomique, lipidomique), la gestion des données manquantes demeure un défi majeur pour exploiter pleinement l'information disponible. Pour relever ce défi, des approches méthodologiques spécifiques sont nécessaires pour intégrer différentes modalités de données et identifier les mécanismes d'action impliqués dans la réponse d'un organisme à un stress.
Eliminer les données manquantes, peut non seulement réduire la précision, mais aussi introduire des biais significatifs dans les modèles d'analyse intégrative, conduisant finalement à des résultats erronés. Ces problématiques sont étroitement liées aux caractéristiques intrinsèques des données générées et aux méthodes d'intégration utilisées pour traiter ces ensembles de données volumineux, souvent impactés par un nombre important de données manquantes. Observées à différentes échelles biologiques, ces données présentent des niveaux de fluctuation pouvant être influencés par des facteurs confondants et/ou des co-expositions, qui nécessitent l'application de facteurs correctifs dans l'analyse des données.
Le candidat sera impliqué en premier temps à développer des algorithmes et des modèles statistiques pour l'analyse de grands ensembles de données biologiques. En particulier, nous gérerons les données manquantes et étudierons l'effet des facteurs confondants et de co-exposition (Goujon E et al., ). Cependant, les données multiblocs ont souvent une structure manquante, c'est-à-dire que les données d'un ou plusieurs blocs peuvent être complètement inobservées pour un échantillon. Dans ce travail, nous chercherons à traiter correctement les structures de données manquantes et à les comparer à la bibliographie (Peltier C et al., ; Baena-Miret S et al. ). Les méthodes de gestions des données manquantes seront développées dans le cadre d'une version globale de RGCCA [Gloaguen A ; Girka F ], permettant d'extraire simultanément les composantes de chaque bloc à l'aide d'un unique problème d'optimisation. Cela contribue à atténuer les biais d'erreur induits par les données manquantes dans le cadre de l'approche séquentielle. Les approches séquentielle et globale de RGCCA pour la gestion des données manquantes seront enfin comparées sur données simulées.
Les données sont déjà générées. Les deux premières années de la thèse seront consacrées au développement méthodologique pour l'imputation des données et l'incorporation des facteurs dans une analyse intégrative. Et la dernière année sera l'analyse des données et l'interprétation des résultats par une analyse d'enrichissement des voies biologiques. Le doctorant effectuera 60% de son temps de recherche au LRAcc (ASNR) et 40% à L2S (CentraleSupelec, Paris). La publication des résultats dans des revues internationales et la participation à des conférences sont attendus
Profil recherché
Le ou la candidat(e) doit être titulaire d'un master en Mathématique appliquées, Statistiques (parcours data et/ou analyse et modélisation des données) ou domaine connexe avec un intérêt pour la recherche en biologie ou en santé. Le ou la candidat(e) devra posséder un solide bagage théorique en algèbre linéaire et en statistique. Afin de valider et d'appliquer les méthodes développées, il est demandé la maitrise d'outils de programmation tels que R et Python. Un bon niveau d'anglais est souhaitable. La capacité à travailler en équipe multidisciplinaire sera appréciée.
Télétravail
Occasionnel
Informations complémentaires / avantages
Le doctorant effectuera 60% de son temps de recherche au sein du LRAcc à l'ASNR sous l'encadrement de Dr. GARALI Imène et 40% au L2S (CentraleSupelec, Paris) sous la direction du Pr. TENENHAUS Arthur. Des réunions régulières avec les biologistes du LRTOX à l'ASNR sont prévues (Dr. EBRAHIMIAN CHIUSA Teni et Dr. GRISON Stéphane).
Diversité
La diversité est une des composantes de la politique RSE, RH et Qualité de Vie au Travail à lASNR. Nous accordons la même considération à toutes les candidatures, sans discrimination, pour inclure tous les talents.
Quelles que soient les différences, nous souhaitons attirer, intégrer et fidéliser nos candidats et nos collaborateurs au sein dun environnement de travail inclusif.
LASNR conduit une politique active depuis de nombreuses années en faveur de l'égalité des chances au travail et l'emploi des personnes handicapées. Si vous êtes en situation de handicap, n'hésitez pas à nous faire part de vos éventuels besoins spécifiques afin que nous puissions les prendre en compte.
Localisation du poste
Localisation du poste
Europe, France, Ile-de-France, Hauts-de-Seine
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.