Informations générales
Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public
Intitulé de l'offre : Assistant-e ingénieur-e en production, traitement de données et enquêtes H/F
Référence : UMR7107-MOBINT-P54009
Lieu de travail : VILLEJUIF
Institut : INSHS - Institut des sciences humaines et sociales
Date de publication : mercredi 3 décembre 2025
Session : Campagne Hiver 2026
Groupe de Fonction : AIG2
BAP : D - Sciences Humaines et Sociales
Emploi type : Assistante ingenieure ou assistant ingenieur en production, traitement de donnees et enquetes
Missions
Contribuer à la conception et la mise en œuvre de protocoles de collecte, de publication électronique et de traitement de corpus de langues rares. Participer à la préparation des corpus audio/vidéo annotés pour publication électronique (archivage), en étroite collaboration avec les chercheurs (Sciences du langage et Anthropologie linguistique) et les ingénieur-es et technicien-nes du laboratoire.
Activités
- Participer à la conception et à l'organisation de corpus multimédia de langues rares dans une archive ouverte, la collection « Pangloss » (.
- Contribuer à la valorisation et à la diffusion des résultats, en particulier via le site. - Assurer les opérations de codage et de recodage de métadonnées et d'annotations.
- Contribuer à la qualité et à la cohérence des corpus par un suivi des projets, de la collecte à la publication électronique des données.
- Former et conseiller les chercheurs en matière d'outils d'annotation et de traitement.
- Aider à paramétrer les outils selon les particularités des projets et situations d'enquête.
- Exercer une veille sur les méthodes d'enquêtes et les outils de traitement de données.
Compétences
Savoirs :
- Méthodes et outils en traitement et analyse des données, en particulier celles des enquêtes linguistiques de terrain (Maîtrise).
- Méthodes et outils en production de données (connaissance générale)
- Principes de gestion des métadonnées : préconisations du réseau OLAC (Open Language Archives Community) d'archives ouvertes, outils spécialisés
- Systèmes de gestion de base de données (connaissance générale)
- Familiarité avec les technologies web : connaissance générale HTML, XML
- Archivage pérenne des données de recherche (notions)
- Connaissances générales en linguistique souhaitables. Un rudiment en ethnologie/anthropologie serait un plus.
- Cadre légal et déontologique (connaissance générale)
- Techniques de présentation écrite et orale
- Langue anglaise : B1 (cadre européen commun de référence pour les langues)
- Une familiarité préalable avec les outils logiciels d'annotations les plus couramment employés en linguistique de terrain serait un plus (Elan, Toolbox,
Savoirs faire:
- Savoir assurer la traçabilité des procédures de traitement des informations.
- Savoir transférer les données d¿un logiciel à un autre (en traitement manuel ou en paramétrant des scripts Python existant).
- Savoir participer à la rédaction des textes de présentation des divers corpus sur, en français et en anglais
Savoirs-être :
- Travailler en équipe avec des chercheurs, des spécialistes d'informatique, d'audiovisuel, d'Information Scientifique et Technique
- Savoir s'adapter d'une façon qui encourage la créativité
Contexte de travail
La mission du LACITO (Langues et Civilisations à Tradition Orale, UMR 7107 CNRS / Sorbonne Nouvelle / INALCO) est de décrire et étudier la diversité des langues et des civilisations à tradition orale. Cette mission comporte un caractère d'urgence, du fait de l'érosion de cette diversité, parallèle à l'érosion des écosystèmes et la chute de la biodiversité. La collection Pangloss, archive ouverte principalement dédiée aux langues à tradition orale, regroupe des corpus dans près de 200 langues. Cette collection, en libre accès pour tous les publics (, est au cœur d'un environnement de Science ouverte, l'enjeu étant de parvenir à un progrès cumulatif des connaissances, grâce à un appui mutuel entre données, outils et publications.
Le LACITO est un laboratoire « à taille humaine », à la gouvernance collégiale : un laboratoire à l'écoute des langues, à l'écoute des gens. Au sein du laboratoire, la personne recrutée travaillera en équipe avec une ingénieure (qui assure dépôt des données en archive pérenne, maintenance d'éléments d'applications informatiques, et nouvelles innovations) et un technicien. Le travail autour des corpus oraux bénéficie de relations de confiance et d'étroite collaboration avec des partenaires d'autres institutions dont la Très Grande Infrastructure de Recherche Huma-Num, la Bibliothèque nationale de France et le Laboratoire Ligérien de Linguistique (voir à titre d'exemple : https:///actualite/datathon/).
Contraintes :
Du fait du rôle central des interactions avec les collègues, la présence sur site revêt une importance évidente. Le poste est néanmoins compatible sans difficulté particulière avec le télétravail partiel selon les règlements et préconisations du CNRS.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.