Fondée en 1872, Sciences Po est une université internationale de référence en sciences humaines et sociales. Avec 7 campus, 8 écoles et 11 centres de recherche, elle forme les générations futures grâce à un enseignement pluridisciplinaire alliant savoirs fondamentaux et expertise professionnelle. Sa communauté rassemble 15 000 étudiants, 1 200 salariés, 280 chercheurs et 4 500 chargés d'enseignement, dont la diversité constitue une richesse unique. Sciences Po est la première université française à avoir obtenu le label « Égalité professionnelle » (AFNOR, 2019 et 2023) et la certification « Top Employer » en 2025.
Unité mixte fondée par Sciences Po et le CNRS en 2005, le Centre de données socio-politiques (CDSP) est l'un des principaux centres français de production et de gestion de données pour les sciences sociales. Il remplit des missions essentielles de documentation, de mise à disposition et de production d'enquêtes et de données de recherche. Fort d'une équipe d'environ vingt ingénieur·es spécialisé·es, le CDSP propose une offre de services complète à la communauté scientifique : collecte, traitement, diffusion des données, développement de solutions numériques. Il contribue également à la recherche méthodologique, tant qualitative que quantitative.
Le ou la Data Scientist recruté.e fera partie de l'équipe Documentation du CDSP et sera placé.e sous la responsabilité hiérarchique de la coordinatrice du WorkPackage 3 du projet FAIRwithDDI (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/fairwithddi/).
Il ou elle travaillera en lien avec les membres de l'équipe projet en charge de la réalisation de ce WorkPackage et avec la responsable du projet FAIRwDDI et de l'équipe Documentation. Le ou la Data Scientist recruté·e interviendra dans le cadre du troisième volet du projet ANR FAIRwDDI : Upscaling metadata using AI.
L'objectif est de concevoir un protocole automatisé de curation de métadonnées reposant sur des techniques de traitement automatique du langage naturel (NLP) et d'apprentissage machine, en vue d'améliorer l'interopérabilité des données d'enquête en sciences humaines et sociales (SHS).
Ce travail s'inscrit également dans le développement de l'outil ReQuest, conçu pour explorer et comparer des questions d'enquêtes en SHS. Le protocole élaboré dans le cadre de FAIRwDDI y sera intégré pour enrichir les possibilités de navigation. Les missions s'articuleront également avec les travaux du projet ONTOLISST (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/ontolisst/), dans une démarche commune visant à favoriser l'harmonisation et l'interopérabilité des métadonnées en SHS.
Le ou la Data Scientist aura pour mission principale le développement et l'automatisation du protocole de curation des métadonnées des enquêtes du CDSP et des partenaires du projet selon le standard de valorisation de données Data Documentation Initiative (DDI). Ce protocole de curation sera ensuite intégré au processus de publication de métadonnées sur l'outil ReQuest.
Activités :
- Développer un protocole de curation automatisée de métadonnées XML DDI basé sur le NLP et/ou l'apprentissage machine ;
- Réaliser une analyse de l'état des métadonnées du CDSP et des partenaires (FSD, INSERM), identifier les écarts, et proposer des règles d'harmonisation ;
- Contribuer à la modélisation, méta-modélisation et appariement de schémas de métadonnées du CDSP et des partenaires ;
- Concevoir et implémenter des règles semi-automatiques de correspondance entre structures de données ;
- Produire des visualisations de l'information (ex. : graphe de connaissances) pour représenter les liens entre métadonnées ;
- Participer à l'intégration du protocole dans l'outil ReQuest, en collaboration avec les membres de l'équipe Projets numériques du CDSP ;
- Documenter les méthodes et procédures mises en place dans une logique de transparence et de réutilisabilité ;
- Présenter les résultats en français et en anglais dans des événements scientifiques, ateliers et réunions de projets.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.