Au sein de l'équipe PaléoEVO de l'Unité Mixte de Recherche UCA-INRAE Génétique Diversité Ecophysiologie des Céréales (GDEC), nous menons des recherches en paléogénomique pour étudier la diversité génétique passée chez le blé via l'analyse d'ADN ancien (aDNA) de restes archéologiques. Adossé à cette équipe de recherche, PALEOLAB est un laboratoire confiné, dédié à l'analyse de restes archéo-botaniques (urlr.me/YhGkvK, Pont et al. 2019 doi : 10.1186/s13059-019-1627-1). Vous participerez au programme DATA (UCA/I-Site) dans le domaine de l'exploitation de l'Intelligence Artificielle pour la génomique pour retracer l'adaptation passée des blés et ouvrir des pistes sur la conception des blés de demain adaptés aux changements globaux. Ce projet associe deux laboratoires :
1. Unité Mixte de Recherche Génétique Diversité Ecophysiologie des Céréales (GDEC) - UCA-INRAE - Clermont-Ferrand (Caroline Pont, Pierre-Louis Stenger et Jérôme Salse) ;
2. Laboratoire d'Informatique, Modélisation et d'Optimisation des Systèmes (LIMOS) UCA - Clermont-Ferrand (Engelbert Mephu Nguifo, professeur à l'ISIMA).
L'équipe d'accueil (UMR GDEC) assure l'accès aux outils bio-informatiques nécessaires à la pleine réalisation du projet (https://hub.mesocentre.uca.fr/docs/cluster/hpc2/). Vous serez sous la responsabilité de Caroline Pont, et entouré.e d'ingénieur.e.s, doctorant.e.s et postdoctorant.e.s spécialisé.e.s en paléogénomique.
Vous serez plus particulièrement en charge de :
Réaliser le benchmarking et le développement d'outils d'intelligence artificielle pour la génomique permettant l'analyse de la diversité génétique ancienne des blés, de sa comparaison avec la diversité génétique mondiale des blés modernes et l'identification de diversités génétiques anciennes et modernes plus particulièrement associées à des origines géographiques particulières et leurs contraintes environnementales associées. Les données d'ADN ancien restant très parcellaires et hétérogènes (données incomplètes, fragmentées, de faible couverture génomique) l'utilisation de deep learning ou l'élaboration de réseaux de neurones artificiels notamment (Graph Neural Network, GNN) peut permettre de prédire les types de blé, en fonction de leur nature génétique, adaptées à des environnements donnés. Des outils sont maintenant disponibles (Sun et al. 2024 ; Zhang et al. 2023) démontrant le potentiel de l'application du machine learning pour la reconstruction d'arbres phylogénétiques à l'aide du jeu d'apprentissage moderne.
Les données d'entraînement disponibles correspondent à :
- 1 420 accessions modernes de blés (couvrant 6 espèces dont T. aestivum, T. durum et T. timopheevii) apportant des données génétiques (3 923 023 polymorphismes de séquences) et des données « passeport » (pays d'origine, date d'enregistrement du cultivar) définissant une structuration géographique de la diversité génétique des espèces (cf publication Sow et al. 2025, doi.org/10.1038/s41477-025-02128-0) ;
- des données phénotypiques associées (Heading Date, Plant Height, Grain Weight) ;
- des données climatiques disponibles sur ClimateDT (https://www.ibbr.cnr.it//climate-dt/) correspondant à 19 variables bioclimatiques et la grille altitudinale disponibles dans la base de données Worldclim (Hijmans et al. 2005, Fick et al. 2017) ;
- des données archéologiques d'échantillons anciens de blés (T. aestivum, T. dicoccum, T. durum, T. timopheevii, T. monococcum.) couvrant 5 000 ans de domestication-sélection, et provenant principalement de sites palafittiques UNESCO de France (cf projet ArkaoAG, https://anr.fr/Projet-ANR-20-CE27-0013).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.