L'étude des petits systèmes chimiques a été révolutionnée ces dernières années par le développement des MLIP, permettant d'aborder des questions restées sans réponse il y a encore cinq ans. L'état de l'art pour les MLIP appliqués à la réactivité chimique implique d'effectuer des calculs quantiques sur l'ensemble de la boîte de simulation, ce qui pose deux problèmes : (i) les MLIP sont spécifiques à un système donné et ne peuvent être facilement extrapolés à un système proche, (ii) le coût de calcul est prohibitif pour les enzymes. Ainsi, les réactions enzymatiques sont encore principalement étudiées par des calculs QM/MM ou des simulations QM/MM-MD. Ces approches ne peuvent être utilisées à grande échelle en raison de leur coût, mais aussi de leur incapacité à capturer les mouvements globaux.
Activités
L'objectif de ce projet est de développer des MLIP destinés à remplacer la QM/MM, menant ainsi à des simulations ML/MM utilisables pour les réactions enzymatiques. Une étape clé dans l'utilisation des MLIP pour la réactivité est de disposer d'un ensemble d'entraînement incluant les structures du réactif, du produit et de l'état de transition : cette construction peut être réalisée via une procédure d'apprentissage actif telle que celle incluse dans le logiciel ArcaNN, développé dans notre laboratoire. Ce projet fusionnera une architecture axée sur le ML/MM pour la spectroscopie avec ArcaNN, dans le but de faciliter la création d'un ensemble d'entraînement diversifié grâce à des simulations d'échantillonnage enrichi et biaisé.
À titre de preuve de concept, nous étudierons l'étape de carboxylation catalysée par la rubisco, qui se trouve être la protéine la plus abondante sur Terre. Notre objectif sera de calculer la barrière d'énergie libre pour la protéine sauvage et pour des mutants obtenus par évolution dirigée, afin d'apporter un éclairage chimique à ces résultats récents. Nous élargirons ensuite l'étude au calcul des profils complets d'énergie libre pour les réactions de carboxylation et d'oxydation. Enfin, nous comparerons les orthologues et expliquerons pourquoi différentes espèces peuvent présenter des caractéristiques cinétiques très différentes pour la rubisco.
Compétences
Le candidat ou la candidate doit être titulaire d'un doctorat en (bio)chimie computationnelle et posséder une expertise en simulations MD, en chimie quantique ou en machine learning. Des connaissances sur les biosystèmes, des compétences en analyse (Python), en scripting (bash et/ou Python) et en machine learning sont des atouts.
Contexte de travail
Le projet se déroulera au sein du laboratoire CPCV (ENS-PSL, SU, CNRS), hébergé par l'École Normale Supérieure dans le Quartier Latin à Paris. Le groupe de chimie théorique de CPCV est multidisciplinaire tant au niveau des méthodes que des applications, et bénéficie d'une large reconnaissance pour ses activités. Le groupe accueille 15 à 20 stagiaires, doctorant(e)s et post-doctorant(e)s. Au cours du projet, nous collaborerons avec Guillaume Stirnemann et Damien Laage, qui apporteront leur expertise en ML, ainsi qu'avec Julien Henri pour son expertise sur la photosynthèse.
Le projet se déroulera au sein du laboratoire CPCV (ENS-PSL, SU, CNRS), hébergé par l'École Normale Supérieure dans le Quartier Latin à Paris. Le groupe de chimie théorique de CPCV est multidisciplinaire tant au niveau des méthodes que des applications, et bénéficie d'une large reconnaissance pour ses activités. Le groupe accueille 15 à 20 stagiaires, doctorant(e)s et post-doctorant(e)s. Au cours du projet, nous collaborerons avec Guillaume Stirnemann et Damien Laage, qui apporteront leur expertise en ML, ainsi qu'avec Julien Henri pour son expertise sur la photosynthèse.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.