Publiée le 17 juin
Mission du poste
Mission : La personne recrutée aura pour principale mission de contribuer au développement des activités du projet ReligiS dans l'axe 6 Gestion des données et humanités numériques, en lien avec les activités des axes scientifiques. L'axe 6 a pour objectif de soutenir la réflexion sur le sujet "Religion et Numérique" et d'apporter un soutien coordonné pour garantir une structuration adéquate des données acquises ou produites, conformément aux principes internationaux de la science ouverte. Il s'agira notamment, pour la personne recrutée, d'analyser les représentations et les circulations du fait religieux sur le web, en mobilisant les formats d'archivage standards (WARC, WAT, WET) et avancés (WANE), à partir de sources comme Spark Internet Archive ou des collectes ciblées de la BNF. Activités : - Participer à la structuration, l'enrichissement sémantique, l'indexation et l'analyse des archives collectées à grande échelle ; - Collaborer avec les chercheurs en SHS du projet ; - Webscraping, développement d'outils pour extraire, transformer et indexer les contenus (métadonnées, textes, entités) ; - Intégrer des outils de traitement automatique du langage (NLP) pour l'extraction d'entités nommées (NER) ; - Structurer les données, les analyses et les visualiser (ElasticSearch ou SolR, MongoDB, graphes) ; - Rédiger la documentation technique, mettre en place des démonstrateurs, assurer la publication des corpus et l'analyse des données.
Profil recherché
Experience: Débutant accepté
Entreprise
Le Centre national de la recherche scientifique, plus connu sous son sigle CNRS, est un établissement public à caractère scientifique et technologique (EPST). Pour relever les grands défis présents et à venir, ses scientifiques explorent le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Internationalement reconnu pour l’excellence de ses travaux scientifiques, le CNRS est une référence aussi bien dans l’univers de la recherche et développement que pour le grand publ...