Topic description
L'objectif de cette thèse est de développer des approches statistiques pour l'analyse des études d'association Génome-Environnement (GEA) et de Décalage Génomique (Genomic Offset, GO) en s'appuyant sur les développements récents en optimisation et en inférence statistique. Plus précisément, le/la doctorant(e) recruté(e) développera des approches d'inférence variationnelle et d'optimisation stochastique pour la GEA afin d'accélérer l'inférence, afin de pouvoir analyser des jeux de données génomiques de grande taille modernes pouvant concerner des centaines de populations. Il/elle développera également des modèles probabilistes de GO inspirés de l'approche d'Analyse de Redondance et l'étendra en la combinant à des réseaux de neurones afin de traiter les relations non linéaires entre covariables et variables de réponse. À cette fin, le/la doctorant(e) rejoindra un consortium de chercheurs issus de différentes disciplines et bénéficiant d'une longue expérience en projets interdisciplinaires. La méthodologie développée sera appliquée à des jeux de données publics à des fins d'analyse comparative, ainsi qu'à un ensemble innovant de deux jeux de données correspondant à une plante domestique (le maïs) et à son ancêtre sauvage (la téosinte). La comparaison entre les deux espèces permettra d'étudier comment l'adaptation des espèces sauvages apparentées aux cultures aux environnements secs pourrait être informative sur la réponse du maïs à un climat plus extrême.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/
WEB :
Funding category
Other public funding
Funding further details
ANR*Autre type de financement
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.