Topic description
La vérification de l'information est une pierre angulaire du journalisme et de la cohésion sociétale, en particulier dans le contexte des discours scientifiques en ligne [2]. Des affirmations telles que « Une étude de Stanford montre que les vaccins contre la COVID-19 provoquent le cancer » illustrent comment la désinformation repose souvent sur la simplification excessive et la décontextualisation [3]. Ces phénomènes, bien que généralisés dans les discours en ligne, constituent un véritable obstacle à la vérification des informations liées à la science, où le niveau de détail et la complexité du contexte global sont essentiels pour comprendre le sens d'une affirmation et donc en évaluer la véracité [4].
Les systèmes actuels de vérification des faits basés sur l'IA fonctionnent généralement au niveau d'énoncés isolés, ce qui peut involontairement renforcer ces problèmes. Même des contenus journalistiques de haute qualité peuvent être sortis de leur contexte et utilisés par des acteurs malveillants dans des campagnes stratégiques nuisibles, où journalistes et agents d'IA disposent de peu de retours pour évaluer et atténuer ce risque. Pourtant, les pratiques journalistiques soulignent que les affirmations doivent être comprises en relation les unes avec les autres et dans leur contexte (plus large).
**Objectifs**
S'appuyant sur des projets récents et en cours menés par l'équipe ADVANSE (ANR AI4Sci, FEDER IA-EMOTION, ANR EMO-SCI), l'objectif central de cette thèse est de définir, construire et exploiter des récits computationnels afin d'améliorer la vérification des discours scientifiques en ligne.
Plus précisément, la thèse abordera trois principales questions de recherche :
* **Définition :** Qu'est-ce qui constitue un récit computationnel ? Quels en sont les composants essentiels (affirmations, entités, événements, dates, contextes scientifiques et médiatiques) ?
* **Extraction et mise en relation des affirmations :** Comment ces éléments narratifs peuvent-ils être extraits automatiquement et reliés à partir de sources de données hétérogènes ?
* **Application :** Comment les récits computationnels peuvent-ils améliorer la vérification des discours scientifiques en ligne par rapport aux approches centrées sur des affirmations isolées ?
L'objectif est de recontextualiser des informations fragmentées en mettant au jour des relations cachées et en les structurant en objets cohérents, interprétables par des machines, que nous appelons récits. Ceux-ci seront organisés sous forme de graphes de connaissances partagés publiquement afin de favoriser leur appropriation, leur interopérabilité, leur réutilisation et une adoption à plus grande échelle.
Cette thèse propose un changement de paradigme : au lieu de vérifier des affirmations isolées, elle introduit le concept de récits computationnels, dans lesquels les affirmations sont intégrées dans des contextes structurés (scientifiques, sociaux, temporels), formant ainsi un objet d'analyse plus riche. Des exemples de tels récits incluent « les vaccins contre la COVID-19 », « l'élection présidentielle française de », etc.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Information verification is a cornerstone of journalism and societal cohesion, particularly in the context of science-related discourse online [2]. Claims such as “A Stanford study shows that COVID-19 vaccines cause cancer” illustrate how disinformation often relies on oversimplification and decontextualization [3]. These phenomena, although universal for online discourse, become a true obstacle for verifying science-related information, where the detail and complexity of the full context is essential for understanding the meaning of the claim and hence its veracity [4]. Current AI-based fact-checking systems typically operate at the level of isolated claims, which can inadvertently reinforce these issues. Even high quality journalistic material can be taken out of context and used by malicious actors in strategic harmful campaigns, where journalists and AI agents alike have little feedback to assess and mitigate this risk. However, journalistic practices emphasize that claims should be understood in relation to one another and within their (broader) context. This thesis proposes a paradigm shift: instead of verifying isolated claims, it introduces the concept of computational narratives, where claims are embedded within structured contexts (scientific, social, temporal), forming a richer object of analysis. Examples of such narratives include “Covid-19 vaccines',, “French presidential election ”, etc.
Objectives
Building on recent past and current projects led by the ADVANSE team (ANR AI4Sci, FEDER IA-EMOTION, ANR EMO-SCI), the central aim of this thesis is to define, construct, and exploit computational narratives to improve the verification of science-related discourse online.
Specifically, the thesis will address three main research questions:
- Definition: What constitutes a computational narrative? What are its core components (claims, entities, events, dates, scientific and media contexts)?
- Extraction and claim linking: How can these narrative elements be automatically extracted and linked from heterogeneous data sources?
- Application: How can computational narratives enhance the verification of online scientific discourse compared to claim-level approaches?
The goal is to re-contextualize fragmented information by surfacing hidden relationships and structuring them into coherent, machine-interpretable objects, that we name narratives, structured as publicly shared knowledge graphs in order to enhance take up, interoperability, reuse and larger adoption.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/
Funding category
Public funding alone (i.e. government, region, European, international organization research grant)
Funding further details
Concours pour un contrat doctoral
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.