Contexte et atouts du poste
Ce doctorat sera effectué dans le cadre d'une collaboration Inria-Inalco financée par le centre d'évaluation de l'IA (INESIA). Le doctorant sera co-encadré par Antoine Boutet (Prof. Insa Lyon, membre de l'équipe Privatics Inria) et Claude Castelluccia (Directeur de Recherche Inria, équipe Privatics)
Mission confiée
Contexte et motivation
Les modèles d’intelligence artificielle à usage général (notamment les grands modèles de langage) sont désormais capables d’interagir de manière fluide avec les individus et de produire des contenus influençant leurs perceptions, leurs jugements et leurs décisions. Le cadre réglementaire européen (AI Act) identifie explicitement les risques liés aux capacités d’influence et de manipulation de ces systèmes, incluant la désinformation, la persuasion ciblée et l’exploitation des biais cognitifs.
Cependant, l’évaluation de ces risques demeure aujourd’hui largement insuffisante. Les approches expérimentales centrées sur l’individu sont limitées par des contraintes éthiques et méthodologiques, tandis que les approches en «boîte blanche» nécessitent un accès aux modèles, rarement disponible. Il en résulte un manque critique de méthodes robustes permettant d’évaluer, de manière indépendante et à grande échelle, les capacités de manipulation cognitive des systèmes d’IA.
Problématique
Dans quelle mesure est-il possible de détecter, caractériser et mesurer les capacités d’influence et de manipulation cognitive des modèles d’IA, en l’absence d’accès à leurs mécanismes internes, et comment ces capacités contribuent-elles à un risque cognitif systémique ?
Objectifs scientifiques
Cette thèse vise à développer une méthodologie d’évaluation en boîte noire des capacités de manipulation des modèles d’IA. Les objectifs principaux sont :
-Définir une typologie des mécanismes d’influence (persuasion, biais normatifs, cadrage discursif, etc.) dans les sorties des modèles ;
-Concevoir un protocole expérimental automatisé, inspiré des techniques de sécurité informatique (fuzzing), pour explorer systématiquement les comportements des modèles ;
- Développer des métriques quantitatives permettant de mesurer l’influence (orientation normative, cohérence, intensité persuasive) ;
-Mettre en œuvre une analyse à grande échelle des réponses générées par différents modèles (comparaison inter-LLMs) ;
-Formaliser le concept de risque cognitif systémique, en lien avec les cadres réglementaires et de sécurité.
Contributions attendues
La thèse ambitionne de produire :
- Un cadre méthodologique robuste pour l’évaluation des capacités d’influence des IA ;
- Des outils d’analyse automatisée des contenus générés ;
- Des indicateurs quantitatifs de manipulation cognitive ;
- Une caractérisation comparative des modèles existants ;
- Une formalisation théorique du risque cognitif dans les systèmes d’IA.
Principales activités
Principales activés
La thèse ambitionne de produire :
- Un cadre méthodologique robuste pour l’évaluation des capacités d’influence des IA ;
- Des outils d’analyse automatisée des contenus générés ;
- Des indicateurs quantitatifs de manipulation cognitive ;
- Une caractérisation comparative des modèles existants ;
- Une formalisation théorique du risque cognitif dans les systèmes d’IA.
Profil de l’étudiant recherché
Le candidat ou la candidate devra être titulaire d’un Master en informatique ou équivalent, avec de solides compétences en intelligence artificielle et en {sécurité informatique. Une expérience ou un intérêt marqué pour le traitement automatique des langues (TAL) constituera un atout.
Un fort intérêt pour les approches interdisciplinaires est attendu, notamment à l’interface avec les \textbf{sciences cognitives}, la psychologie ou le droit du numérique. La capacité à travailler à l’intersection de plusieurs domaines scientifiques sera essentielle.
Le candidat devra également faire preuve de rigueur scientifique, d’autonomie, et de bonnes capacités en anglais.
Compétences
1. Master en informatique ou équivalent
2. Solides compétences en intelligence artificielle et en sécurité informatique
3. Rigueur scientifique, Autonomie
4. Bon niveau d'anglais.
Avantages
5. Restauration subventionnée
6. Transports publics remboursés partiellement
7. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
8. Possibilité de télétravail 90 jours/an fixes ou flottants et aménagement du temps de travail
9. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
10. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
11. Accès à la formation professionnelle
12. Participation Protection Sociale Complémentaire sous conditions
Rémunération
2 200 euros brut /mois
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.