Topic description
Les approches d'IA/ML de chimie générative permettent de concevoir des molécules de novo, mais restent souvent peu pilotables de manière interactive, calculs en batch, compromis difficiles à comprendre, et candidats parfois peu synthétisables. Cette thèse en informatique (IA + IHM) vise à transformer l'identification et le design de molecules a visée therapeutiques en une exploration interactive, explicable et reproductible, où l'algorithme de chimie générative explore systématiquement l'espace chimique et l'expert guide, biaise et contrôle les zones de l'espace chimique explorées. La boucle homme-machine s'appuie sur les principes « mixed-initiative » [1] et des recommandations de conception pour systèmes IA orientés utilisateur [2].
À partir d'un complexe récepteur–ligand (protéine ou ARN), nous extrairons un pharmacophore basé sur la structure décrivant les interactions moléculaires (liaisons H, hydrophobes, charges, aromatiques) et les volumes d'exclusion [3]. La génération est formulée comme une recherche dans un graphe/arbre de fragments moléculaires exploré par un Monte Carlo Tree Search (MCTS) multi-objectif : satisfaction des contraintes du pharmacophore, contraintes physico-chimiques, diversité/nouveauté et a priori de synthétisabilité [11]. Nous allons développer une variante de MCTS sous contraintes et sa robustesse aux biais définis interactivement (contraintes dures, re-pondération, verrouillage d'un motif).
Nous llons pour cela développer une interface 3D temps réel basée sur VTX développé dans l'équipe [7] : affichage du site de liaison, du pharmacophore, des candidats et interactions satisfaites/violées. Des contributions en informatique graphique sont attendues (rendu multi-candidats, gestion d'occlusions, focus+context, picking robuste, interactivité). Les candidats produits sont évalués par différentes méthodes : filtres rapides de synthétisabilité (RDKit/SA score [4]), scoring docking/champ de force, puis rescoring interprétable par champs d'interaction (MIF [5]) et NCI [6]. Des applications sur les interactions protéine - ARN seront envisagées avec nos collaborateurs experimentaux. Les ligands ARN, où certaines contraintes comme π-stacking et T-shape sont déterminantes [10] permettront d'évaluer la pertinence de la méthode développée .
Le projet est co-encadré par le Pr Matthieu Montes (CQSB UMR) et le Dr Antoine Taly (LBT UMR), s'appuyant sur UDock/UDock2 [8], VTX [7], SMIFER [9] et ClearSMILES (Reboul & Taly, JCIM) [10].
Références (sélection) : [1] Horvitz, CHI. [2] Amershi et al., CHI. [3] Wolber & Langer, JCIM. [4] Ertl & Schuffenhauer, J Cheminf. [5] Goodford, J Med Chem. [6] Contreras-García et al., JCTC. [7] Maria et al., Bioinformatics (VTX). [8] Levieux et al., Faraday Discuss ; Plateau-Holleville et al., Bioinformatics. [9] Barquero Morera et al., JCTC (SMIFER). [10] Reboul et al., JCIM (ClearSMILES) ; Childs-Disney et al., Nat Rev Drug Discov. [11] Gao et al., PNAS (SynFormer).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Generative chemistry powered by AI/ML can allow to design molecules de novo and explore a vast chemical space. These workflows remain hard to control: batch outputs, unclear trade-offs, and candidates that are difficult to synthesize. This PhD proposal (Computer Science: AI + HCI) aims to turn structure-based ligand design into an interactive, explainable and reproducible exploration loop where a generative chemistry algorithm explores systematically chemical space interactively guided and constrained by the expert to preserve intent and agency. The human loop follows mixed-initiative principles [1] and established Human–AI interaction guidelines [2].
Starting from a receptor–ligand complex (protein or RNA), we will compute a structure-based pharmacophore encoding molecular interaction features (H-bond donors/acceptors, hydrophobics, charges, aromatic/stacking motifs), spatial tolerances, and excluded volumes [3]. Ligand generation is formulated as exploration of a graph/tree of partial molecules (fragments/reactions/conformations) searched by constrained, multi-objective Monte Carlo Tree Search (MCTS): pharmacophore satisfaction, physicochemical constraints, novelty/diversity, and synthesizability priors. Building on recent work that navigates explicitly synthesizable chemical space [11], we will study constrained MCTS variants and how to support online user edits—hard constraints, reweighting, or “locking” key interaction motifs.
We will develop a real-time 3D visual analytics interface built on VTX developed in the lab [7]. It displays the pocket, pharmacophore, streamed candidates and satisfied/violated interactions. Expected computer-graphics contributions include multi-candidate rendering, occlusion management, focus+context, robust picking, and interactive rendering. A staged quality-control cascade ensures realism: fast synthesizability filtering (RDKit/SA score [4]), docking/force-field scoring, then interpretability-oriented rescoring using Molecular Interaction Fields (MIF [5]) and NCI [6]. A strong application axis targets RNA binding sites, where π-stacking and T-shaped stacking are critical [10] and will be exposed as steerable constraints.
Co-supervision: Prof. Matthieu Montes (CQSB UMR) and Dr Antoine Taly (LBT UMR), leveraging UDock/UDock2 [8], VTX [7], SMIFER [9] and ClearSMILES (Reboul & Taly, JCIM) [10].
Selected references: [1] Horvitz, CHI. [2] Amershi et al., CHI. [3] Wolber & Langer, JCIM. [4] Ertl & Schuffenhauer, J Cheminf. [5] Goodford, J Med Chem. [6] Contreras-García et al., JCTC. [7] Maria et al., Bioinformatics (VTX). [8] Levieux et al., Faraday Discuss ; Plateau-Holleville et al., Bioinformatics. [9] Barquero Morera et al., JCTC (SMIFER). [10] Reboul et al., JCIM (ClearSMILES) ; Childs-Disney et al., Nat Rev Drug Discov. [11] Gao et al., PNAS (SynFormer).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/
Funding category
Public funding alone (i.e. government, region, European, international organization research grant)
Funding further details
Concours pour un contrat doctoral
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.