Informations générales
Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public
Intitulé de l'offre : Ingénieur-e d'étude en traitement de données linguistiques, linguistique africaine H/F
Référence : UMR8135-MOBINT-O54012
Lieu de travail : VILLEJUIF
Institut : INSHS - Institut des sciences humaines et sociales
Date de publication : mercredi 30 avril 2025
Session : Campagne Printemps 2025
Groupe de Fonction : IEG3
BAP : D - Sciences Humaines et Sociales
Emploi type : Ingénieur-e d’études en production, traitement, analyse de données et enquêtes
Missions
En lien étroit et constant avec notre équipe de recherche spécialisée en linguistique africaine, il s¿agira de dédier sa force de travail aux deux pôles numériques phares de notre unité de recherche : 1) piloter l'enrichissement de la base de données lexicales RefLex pour atteindre au plus vite notre objectif de couverture maximale des langues africaines (1147 langues déjà présentes, objectif : atteindre les 2739 répertoriées à ce jour) ; 2) expertise linguistique et technique pour assurer un pont entre les chercheurs et l'équipe de développement de nos outils de traitement de corpus oraux (Elan, CorpOrAn), assurer la formation et le soutien aux chercheurs, identifier l'évolution des besoins et apporter son expertise linguistique à la conception de nouveaux outils.
Activités
- Proposer une démarche adaptée au développement de nos outils de traitement de données aux besoins des chercheurs
- Concevoir et piloter le dispositif d¿appui à la recherche ainsi créé
- Mettre en œuvre des méthodes ou protocoles pour le recueil de données ou de corpus, former les chercheurs pour en assurer l'analyse et interpréter les résultats
- Assurer la maîtrise d'ouvrage du développement des bases de données et corpus
- Développer et formaliser des méthodes permettant la production ou l'analyse des données ou de corpus
- Concevoir des outils d'interrogation et d'interface entre différentes bases de données ou corpus
- Participer ou animer des réseaux professionnels internes ou externes de valorisation des résultats de recherche afférents.
- Analyser les demandes externes et évaluer leur pertinence par rapport aux orientations scientifiques
- Participer ou coordonner la réponse à des appels d'offre
- Transférer ses compétences dans le cadre d'actions de formation (formation continue, formation à la recherche, formation des étudiants)
- Valoriser les réalisations et les résultats sous forme de publications scientifiques, rapports, présentations orales¿
- Contribuer à la réflexion sur les techniques et les méthodes
- Concevoir et réaliser une veille scientifique et méthodologique
Compétences
Savoirs :
- Linguistique de terrain (Afrique), traitement des données de terrain en langage naturel (langues minoritaires)
- Connaissance de la base de données RefLex (outils de comparaison, outils statistiques, normes de saisie)
- Maîtrise des outils de traitement de corpus (Praat, FLEx, Toolbox)
- Connaissance approfondie des outils Elan (Max Planck) et ElanCorpA
- Maîtrise des plates-formes de valorisation et d'archivage pérenne des données de terrain (Cocoon, CorpOrAn)
- Connaissance d¿outils émergents en traitement et analyse des données (annotation collaborative de corpus, expressions régulières, treebanks¿)
- Cadre légal et déontologique des données de terrain (cadre éthique notamment)
- Techniques de présentation écrite et orale
- Français C1 ; Anglais C1
Savoirs faire :
- Savoir élaborer des outils de collecte (cadre de recueil de corpus oraux sur le terrain)
- Savoir exploiter une base de données (manipulation de données, extraction de données pertinentes, fusion de bases)
- Savoir localiser, répertorier, prioriser, analyser et critiquer les données (savoir statuer sur la pertinence des données ou des sources)
- Avoir des compétences pédagogiques et de transmission des connaissances
- Savoir formaliser les techniques et méthodes de traitement de corpus oraux et lexicaux
- Savoir animer et piloter un groupe de travail dans le respect des compétences de chacun
- Rédiger des rapports ou des documents
- Élaborer un cahier des charges
Savoirs-être :
- Avoir un sens poussé du collectif et du travail en équipe
- Avoir une expérience significative dans un projet d'équipe de recherche à financement externe
Contexte de travail
Le candidat ou la candidate sera rattaché.e au LLACAN, équipe de recherche spécialisée en langues et linguistique africaines, à Villejuif. Dans l'organigramme, il/elle sera placé.e sous l'autorité de la responsable de la politique des données de l'Unité. Par l'exercice de ses fonctions, il/elle contribuera activement au fonctionnement et à la dynamique du collectif.
Le candidat ou la candidate travaillera selon des horaires de bureau. Il/Elle pourra également être amené.e à participer à des ateliers ou à des missions de formation à l'étranger, principalement en Afrique.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.