Topic description
L'intégration des systèmes d'intelligence artificielle dans la pratique médicale se heurte à des obstacles bien documentés. Au-delà des questions de performance, les praticiens semblent régulièrement manifester un manque de confiance envers des outils dont les décisions sont difficiles à interpréter et dont la logique interne est rarement alignée avec leur mode de raisonnement. Ce raisonnement clinique repose en effet sur de nombreux mécanismes cognitifs entremêlés : comparaison de cas similaires, raisonnement par analogie, identification de profils typiques ou de situations inhabituelles. Les modèles actuels, qu'il s'agisse de classifieurs classiques ou de grands modèles de langage, produisent des prédictions souvent performantes mais peu lisibles, ce qui freine leur adoption dans les environnements médicaux.
Ce projet propose d'exploiter les représentations vectorielles denses produites par les modèles d'apprentissage, les embeddings, pour construire des graphes de patients (à partir de données potentiellement multimodales) : des structures dans lesquelles chaque nœud correspond à un individu et chaque lien traduit une relation de proximité ou d'analogie apprise automatiquement. Ces graphes sont enrichis d'indicateurs de représentativité, identifiant les patients prototypiques, et d'atypicité, signalant les situations rares ou singulières. L'approche s'inspire de travaux et résultats issus de la psychologie cognitive (théorie des prototypes, raisonnement par analogie, mémoire relationnelle).
Sur le plan méthodologique, il s'agira de formaliser des métriques de représentativité et d'atypicité à partir des embeddings produits par différents types de modèles (classifieurs, auto-encodeurs, grands modèles de langage, modèles multimodaux), et d'étudier la robustesse et la stabilité des graphes construits. Sur le plan expérimental, les méthodes seront d'abord évaluées sur données simulées puis appliquées à des données médicales réelles textes, images, données tabulaires.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
The integration of artificial intelligence systems into medical practice encounters well-documented obstacles. Beyond issues of performance, practitioners consistently appear to exhibit a lack of trust toward tools whose decisions are difficult to interpret and whose internal logic is rarely aligned with their mode of reasoning. Clinical reasoning indeed relies on numerous intertwined cognitive mechanisms: comparison of similar cases, analogical reasoning, identification of typical profiles or unusual situations. Current models, whether classical classifiers or large language models, often produce high-performing predictions that remain poorly interpretable, thereby hindering their adoption in medical environments.
This project proposes to leverage dense vector representations produced by learning models (embeddings) to construct patient graphs (from potentially multimodal data): structures in which each node corresponds to an individual and each edge encodes a relation of proximity or analogy learned automatically. These graphs are enriched with indicators of representativeness, identifying prototypical patients, and of atypicality, highlighting rare or singular cases. The approach draws on concepts and results from cognitive psychology (prototype theory, analogical reasoning, relational memory).
From a methodological perspective, the objective is to formalize metrics of representativeness and atypicality derived from embeddings produced by different types of models (classifiers, autoencoders, large language models, multimodal models), and to study the robustness and stability of the constructed graphs. Experimentally, the methods will first be evaluated on simulated data and then applied to real medical data, including text, images, and tabular data.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/
Funding category
Public funding alone (i.e. government, region, European, international organization research grant)
Funding further details
Concours pour un contrat doctoral
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.