Ingénieur ou Ingénieure d'études - Lexicomètre H/F, Paris
Description de la mission
La personne recrutée sera animée d'une grande appétence pour le travail collectif. Elle devra être en mesure de concevoir et mettre en œuvre, dans le cadre des projets de recherche conduits par les membres de la faculté permanente, des protocoles de collecte, traitement, analyse et visualisation de données ou corpus textuels. Elle sera dotée des compétences nécessaires à une participation aux choix et à la mise en œuvre des méthodes adaptées aux programmes de recherche développés à titre individuel ou collectif par les membres du laboratoire, tant parmi la faculté permanente que parmi les doctorants et doctorantes, post-doctorants et post-doctorantes.
Sous la responsabilité hiérarchique de la direction du CHSP, vous contribuerez par votre expertise aux activités de recherche menées au sein du Centre d'histoire. Vous apporterez aussi conseil et assistance aux membres du laboratoire, tant dans la préparation des réponses aux appels à projets nationaux, européens et internationaux, que dans la conduite des travaux de recherche puis dans la valorisation et la diffusion des résultats. Vous travaillerez en lien avec les autres spécialistes des traitements et analyses quantitatives et numériques des données au sein de Sciences Po (Médialab, DRIS, CDSP, etc.).
Vous devrez notamment être en mesure d'exercer les activités suivantes :
1. Concevoir une démarche méthodologique adaptée à l'exploitation des données textuelles en histoire ;
2. Coordonner la conduite des opérations de production et de recueil : adapter les techniques aux particularités des sources textuelles historiques (quelles soient ou non numérisées, dans des langues et des formats variables : manuscrits, tabulaires, etc.) ;
3. Organiser le traitement quantitatif, qualitatif, numérique des données textuelles et participer à l'analyse des résultats ;
4. Concevoir et organiser des bases de données ou des corpus textuels en liens avec les objets de recherche des membres du laboratoire ;
5. Participer à l'organisation de manifestations scientifiques en lien avec les axes et domaines du laboratoire ;
6. Participer à la diffusion des travaux menés au Centre d'histoire auprès de la communauté scientifique (rapports, publications, colloques, enseignements, formations, rapports méthodologiques, rapports de recherche...) ;
7. Participer à la réponse à des appels d'offres nationaux, européens, internationaux... en lien avec les membres du Centre d'histoire et la Mission d'appui aux programmes scientifiques (MAPS) ;
8. Transférer vos compétences dans le cadre d'actions de formation et de conseil destinés aux membres du Centre (faculté permanente, doctorants et doctorants, postdocs...) ;
9. Assurer une veille sur les méthodes et outils de traitement, d'analyse et de visualisation de données et corpus textuels en histoire et sciences sociales ;
10. Contribuer à la réflexion sur les approches quantitatives, qualitatives, numériques des données et corpus textuels en histoire et sciences sociales ;
Compétences et connaissances requises :
* Familiarité avec les démarches en sciences humaines et sociales en général, et en histoire en particulier (connaissance générale). Une formation initiale de premier cycle en histoire ou sciences sociales serait appréciée ;
* Méthodes et outils en collecte, analyse (lexicométrie, « topic model », « embeddings », analyse de sentiment) et visualisation de données et corpus textuels (connaissance approfondie) ;
* Environnement et réseaux professionnels des méthodes quantitatives, qualitatives et numériques appliquées à l'histoire (connaissance générale) ;
* Systèmes de gestion de base de données (connaissance générale) ;
* Archivage pérenne de données de recherche (connaissance générale) ;
* Familiarité avec les problématiques de la science ouverte (connaissance générale) ;
* Techniques de présentation écrite et orale ;
* Langue anglaise : B2 (cadre européen commun de référence pour les langues) ;
* Connaissance des méthodes de planification de gestion de données (DMP).
Compétences techniques :
* Mettre en œuvre les outils de collecte de données et corpus textuels (numérisation/océrisation de sources textuelles anciennes ou contemporaines) ;
* Savoir organiser un corpus de données textuelles en vue de son exploitation quantitative et qualitative ;
* Savoir produire des résultats, exploiter une base de données et des corpus textuels ;
* Savoir restituer les résultats d'une étude ou recherche à différents publics (rédaction, visualisations, communications orales...) ;
* Savoir formaliser les besoins, travailler en équipe.
Compétences en programmation et logiciels :
* Connaissance de langages de programmation pour l'analyse statistique et la visualisation de données (R ou Python...) ;
* Expérience en publication de données sur le web (éventuellement via visualisation interactive en js) ;
* Expérience avec les principaux logiciels d'analyse lexicale de données textuelles (Iramuteq/Alceste, Hyperbase, Lexico, TXM...) ;
* Pratique des librairies standards d'analyse textuelle en R et en Python (tidytext, spacy, STM, gensim, etc.) ;
* Optionnellement, expérience dans l'exploitation de modèles de langue (appel à des LLM via API, prompt tuning, fine-tuning de modèles à la Bert) ;
Connaissance de formats de données et gestion :
* Connaissance de langages de format de données (XML, XSLT, XPATH, XML-EAD, XML-TEI...), de systèmes de gestion de bases de données (MySQL...) ;
* Pratique de solutions de versioning de code type git.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.