Doctorant f/h évaluation en boîte noire des capacités de manipulation cognitive des modèles d’ia

Montbonnot-Saint-Martin

INRIA

Publiée le Il y a 23 h

Description de l'offre

Contexte et atouts du poste

Ce doctorat sera effectué dans le cadre d'une collaboration Inria-Inalco financée par le centre d'évaluation de l'IA (INESIA). Le doctorant sera co-encadré par Antoine Boutet (Prof. Insa Lyon, membre de l'équipe Privatics Inria) et Claude Castelluccia (Directeur de Recherche Inria, équipe Privatics)

Mission confiée

Contexte et motivation

Les modèles d’intelligence artificielle à usage général (notamment les grands modèles de langage) sont désormais capables d’interagir de manière fluide avec les individus et de produire des contenus influençant leurs perceptions, leurs jugements et leurs décisions. Le cadre réglementaire européen (AI Act) identifie explicitement les risques liés aux capacités d’influence et de manipulation de ces systèmes, incluant la désinformation, la persuasion ciblée et l’exploitation des biais cognitifs.

Cependant, l’évaluation de ces risques demeure aujourd’hui largement insuffisante. Les approches expérimentales centrées sur l’individu sont limitées par des contraintes éthiques et méthodologiques, tandis que les approches en «boîte blanche» nécessitent un accès aux modèles, rarement disponible. Il en résulte un manque critique de méthodes robustes permettant d’évaluer, de manière indépendante et à grande échelle, les capacités de manipulation cognitive des systèmes d’IA.

Problématique

Dans quelle mesure est-il possible de détecter, caractériser et mesurer les capacités d’influence et de manipulation cognitive des modèles d’IA, en l’absence d’accès à leurs mécanismes internes, et comment ces capacités contribuent-elles à un risque cognitif systémique ?

Objectifs scientifiques

Cette thèse vise à développer une méthodologie d’évaluation en boîte noire des capacités de manipulation des modèles d’IA. Les objectifs principaux sont :

-Définir une typologie des mécanismes d’influence (persuasion, biais normatifs, cadrage discursif, etc.) dans les sorties des modèles ;

-Concevoir un protocole expérimental automatisé, inspiré des techniques de sécurité informatique (fuzzing), pour explorer systématiquement les comportements des modèles ;

- Développer des métriques quantitatives permettant de mesurer l’influence (orientation normative, cohérence, intensité persuasive) ;

-Mettre en œuvre une analyse à grande échelle des réponses générées par différents modèles (comparaison inter-LLMs) ;

-Formaliser le concept de risque cognitif systémique, en lien avec les cadres réglementaires et de sécurité.

Contributions attendues

La thèse ambitionne de produire :

- Un cadre méthodologique robuste pour l’évaluation des capacités d’influence des IA ;
- Des outils d’analyse automatisée des contenus générés ;
- Des indicateurs quantitatifs de manipulation cognitive ;
- Une caractérisation comparative des modèles existants ;
- Une formalisation théorique du risque cognitif dans les systèmes d’IA.

Principales activités

Principales activés

La thèse ambitionne de produire :

- Un cadre méthodologique robuste pour l’évaluation des capacités d’influence des IA ;
- Des outils d’analyse automatisée des contenus générés ;
- Des indicateurs quantitatifs de manipulation cognitive ;
- Une caractérisation comparative des modèles existants ;
- Une formalisation théorique du risque cognitif dans les systèmes d’IA.

Profil de l’étudiant recherché

Le candidat ou la candidate devra être titulaire d’un Master en informatique ou équivalent, avec de solides compétences en intelligence artificielle et en {sécurité informatique. Une expérience ou un intérêt marqué pour le traitement automatique des langues (TAL) constituera un atout.

Un fort intérêt pour les approches interdisciplinaires est attendu, notamment à l’interface avec les \textbf{sciences cognitives}, la psychologie ou le droit du numérique. La capacité à travailler à l’intersection de plusieurs domaines scientifiques sera essentielle.

Le candidat devra également faire preuve de rigueur scientifique, d’autonomie, et de bonnes capacités en anglais.

Compétences

1. Master en informatique ou équivalent
2. Solides compétences en intelligence artificielle et en sécurité informatique
3. Rigueur scientifique, Autonomie
4. Bon niveau d'anglais.

Avantages

5. Restauration subventionnée
6. Transports publics remboursés partiellement
7. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
8. Possibilité de télétravail 90 jours/an fixes ou flottants et aménagement du temps de travail
9. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
10. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
11. Accès à la formation professionnelle
12. Participation Protection Sociale Complémentaire sous conditions

Rémunération

2 200 euros brut /mois

Postuler

Créer une alerte

Sauvegarder

Offre similaire

Phd position f/m phd thesis: artificial cultural belief evolution: flexibility experiments

Montbonnot-Saint-Martin

CDD

INRIA

Offre similaire

Ingénieur scientifique contractuel: simulation des phénomènes non-lisses de disjoncteurs électriques industriels h/f

Montbonnot-Saint-Martin

CDD

INRIA

Offre similaire

Assistante d'equipes de recherche

Montbonnot-Saint-Martin

CDD

INRIA