Stage en tal pour la prédiction des comportements abusifs en ligne

Biot

Stage

Inria

Publiée le 18 janvier

Description de l'offre

Contexte et atouts du poste

Les forums de discussion en ligne, tels que Reddit et X (anciennement Twitter), permettent à des utilisateurs du monde entier de communiquer entre eux. Cependant, les discussions en ligne sont sujettes à des échanges toxiques, soit en raison de comportements antisociaux (ASB) de la part d’utilisateurs malveillants qui cherchent délibérément à perturber une communication efficace, soit du fait d’utilisateurs ordinaires qui peuvent se montrer irrités dans des discussions tendues. L’approche dominante pour atténuer ces comportements repose sur un paradigme réactif post hoc, dans lequel les systèmes classent un message comme toxique une fois celui-ci publié.

Toutefois, un corpus de travaux de recherche en pleine expansion aborde cette problématique selon un paradigme prédictif, à savoir la prévision du déraillement d’une conversation vers des échanges toxiques dès les premiers stades de la discussion. Les modèles relevant de ce paradigme permettent d’envisager des interventions avant que le préjudice ne se matérialise et peuvent suggérer des reformulations plus sûres, ou prioriser des contenus à examiner par les modérateurs et les utilisateurs des forums.

Ce paradigme se heurte néanmoins à plusieurs défis :

1. le système doit être capable de prendre en compte non seulement le contenu des messages individuels, mais aussi les procédés pragmatiques des participants ainsi que la trajectoire conversationnelle ;

2. la dynamique des conversations évolue en permanence au fil des échanges, ce qui nécessite des prédictions dynamiques ;

3. la question de savoir comment inciter efficacement les modérateurs et les utilisateurs à réagir aux risques de déraillement conversationnel demeure encore peu explorée.

Dans ce projet, nous cherchons à répondre à ces trois défis. Un premier résultat concerne le développement d’un prototype permettant une prédiction dynamique de bout en bout du déraillement conversationnel, en combinant des apports linguistiques sur la dynamique des conversations avec des modèles de langage de grande taille (LLM). Un deuxième résultat porte sur la mise au point d’un système pouvant être intégré aux forums de discussion en ligne afin de rappeler aux utilisateurs les risques de déraillement lorsque la probabilité prédite dépasse un certain seuil. Enfin, un troisième axe de recherche propose une taxonomie de stratégies conversationnelles et de contre-discours susceptibles d’aider les utilisateurs et les modérateurs à atténuer les tensions potentielles, ces stratégies étant ancrées dans des théories linguistiques et sociales ainsi que dans les travaux sur le contre-discours.

Mission confiée

Ce stage vise à appliquer un système prédictif afin d’aider les utilisateurs ordinaires des forums de discussion en ligne ainsi que les modérateurs à agir de manière préventive pour éviter l’escalade de tensions potentielles dans la communication et maintenir des échanges efficaces. Le ou la candidat·e sera chargé·e de :

4. Développer un système d’IA léger, fondé sur les travaux de recherche portant sur la modélisation des trajectoires conversationnelles pour la prédiction dynamique du déraillement des conversations.

5. Intégrer ce système dans un forum de discussion en ligne afin d’alerter les utilisateurs des risques de déraillement conversationnel.

6. Mettre en œuvre une taxonomie de stratégies conversationnelles visant à aider les utilisateurs à reformuler leurs messages pour réduire les risques de déraillement, et à permettre aux modérateurs d’intervenir de manière précoce, avant que des dommages ne surviennent.

Principales activités

Ce stage vise à appliquer un système prédictif afin d’aider les utilisateurs ordinaires des forums de discussion en ligne ainsi que les modérateurs à agir de manière préventive pour éviter l’escalade de tensions potentielles dans la communication et maintenir des échanges efficaces. Le ou la candidat·e sera chargé·e de :

7. Développer un système d’IA léger, fondé sur les travaux de recherche portant sur la modélisation des trajectoires conversationnelles pour la prédiction dynamique du déraillement des conversations.

8. Intégrer ce système dans un forum de discussion en ligne afin d’alerter les utilisateurs des risques de déraillement conversationnel.

9. Mettre en œuvre une taxonomie de stratégies conversationnelles visant à aider les utilisateurs à reformuler leurs messages pour réduire les risques de déraillement, et à permettre aux modérateurs d’intervenir de manière précoce, avant que des dommages ne surviennent.

Compétences

Des connaissances ou un fort intérêt pour le traitement automatique du langage naturel (NLP) sont attendus, en particulier pour l’analyse de conversations en ligne. Une familiarité avec les méthodes d’apprentissage automatique et les LLMs constituera un atout important.

Des compétences en programmation Python sont requises, ainsi qu’une première expérience en analyse de données textuelles, incluant le prétraitement, la représentation vectorielle des textes et l’évaluation de modèles. Le ou la candidat·e sera amené·e à exploiter des jeux de données existants et à implémenter des modèles de référence (baselines) pour la modélisation des trajectoires conversationnelles et la détection dynamique du déraillement des discussions.

Une capacité à contribuer au développement et au test de prototypes légers, par exemple via une interface simplifiée ou un environnement de simulation permettant d’intégrer des signaux de risque de déraillement conversationnel, sera appréciée.

Français et anglais (compréhension écrite indispensable ; capacités rédactionnelles appréciées).

Avantages

10. Restauration subventionnée
11. Transports publics remboursés partiellement
12. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
13. Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
14. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
15. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
16. Accès à la formation professionnelle
17. Sécurité sociale

Rémunération

Gratification selon temps de présence

Postuler

Créer une alerte

Sauvegarder

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.