Votre rôle
Le stage s’inscrit dans le cadre du projet Flux Vision d’Orange, qui vise à analyser la mobilité et la présence des personnes sur le territoire à partir de données de localisation issues du réseau mobile, tout en protégeant la vie privée. Pour cela, Orange a développé un générateur de données de trajectoires synthétiques permettant de produire des données anonymisées et représentatives. L’objectif principal du stage est de conceptualiser, développer et tester une méthodologie d’attaque par empoisonnement contre ces générateurs. Il s’agit d’étudier comment altérer le processus d’apprentissage du modèle pour influencer la qualité ou la confidentialité des données synthétiques, tout en restant difficile à détecter.
Les activités principales incluent une étude approfondie de la littérature sur les attaques par empoisonnement, notamment dans le contexte des modèles génératifs et des réseaux de neurones. Le stagiaire devra se familiariser avec les modèles existants de génération de trajectoires, comprendre leur architecture et leur fonctionnement, puis réaliser des expérimentations pour évaluer leur vulnérabilité face à différentes perturbations. Il sera également chargé de définir des scénarios d’attaque illustrant l’impact potentiel sur la vie privée et la représentativité statistique des données, en montrant comment ces attaques peuvent manipuler ou dégrader la qualité des données synthétiques.
Ensuite, le stagiaire devra concevoir et implémenter des stratégies d’empoisonnement adaptées, en entraînant les modèles victimes d’attaques simulées, et en évaluant leur efficacité à manipuler la sortie tout en restant discrètes. La validation de ces méthodes se fera à l’aide d’une méthodologie d’évaluation des performances, en utilisant des métriques pertinentes pour mesurer l’impact sur la distribution des données, la détection des attaques, et la protection de la vie privée. Enfin, des recommandations seront proposées pour renforcer la robustesse des générateurs face à ces menaces.
Les résultats attendus sont une meilleure compréhension des techniques d’attaque par empoisonnement dans ce contexte, des scénarios concrets illustrant leur faisabilité, une méthodologie d’attaque opérationnelle avec des prototypes exploitables, ainsi que des pistes pour améliorer la sécurité et la confidentialité des générateurs de données synthétiques. Le stagiaire sera intégré à une équipe pluridisciplinaire, travaillant en mode agile, avec un encadrement par un référent expérimenté, dans un environnement innovant alliant recherche, développement et enjeux de sécurité liés à la protection des données.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.