Sous la responsabilité scientifique de Mathilde Plard, chercheuse CNRS, vos missions principales seront de :
• Cartographier les sources documentaires et calibrer les volumes par strate de corpus
• Concevoir et tester les requêtes d'extraction sur l'infrastructure ISTEX (Inist-CNRS)
• Moissonner et structurer un corpus unifié à partir d'ISTEX, HAL, OpenAlex, PubMed et de sources complémentaires
• Curer et homogénéiser des sources hétérogènes (articles, chapitres, presse spécialisée, podcasts transcrits)
• Développer un pipeline reproductible de fouille de textes (extraction d'entités, modélisation thématique, cartographie des affiliations)
• Co-rédiger deux articles scientifiques internationaux et un data paper
• Préparer la mise à disposition du corpus selon les principes FAIR et la politique d'open science du CNRS
• Contribuer à la valorisation scientifique du projet (séminaires, colloques, ateliers méthodologiques)
Vous pouvez télécharger la fiche de poste complète
You can download the full job description
--
Poste ouvert uniquement aux contractuels. Ce poste est ouvert sous réserve de l'obtention du financement d'Angers Loire Métropole.
Catégorie/corps : POST-DOC
Diplôme minimum requis : Doctorat de moins de 3 ans en sciences humaines et sociales— sociologie du sport, géographie sociale, STAPS, anthropologie, sciences de l'information et de la communication avec une ouverture documentée vers les humanités numériques ou méthodes computationnelles. Les profils issus des humanités numériques ou de la science des données appliquée aux SHS sont également bienvenus, sous réserve d'un ancrage scientifique avéré dans le champ du sport.
Type de contrat et durée: Contrat post-doc de 12 mois
Rémunération brute mensuelle : 2700€
Date de prise de poste souhaitée : 01/10/2026
Quotité de travail : 100%
Date limite de candidature : Le 16/07/2026
Modalités de recrutement : CV, lettre de motivation et diplôme de doctorat de moins de 3 ans obligatoires. Nous ne pourrons pas étudier votre candidature si nous n'avons pas ces trois documents.
Avantages liés au poste :
50 jours de congés annuels dès la première année (au prorata de votre date d’arrivée)
Télétravail possible selon nécessités et organisation du service
Prise en charge à 75% de l’abonnement aux transports en commun
Des offres loisirs, sport et culture pour tous les personnels
Possibilité de parking du personnel
Parcours d’accueil et formations
Vous êtes passionné·e par le sport, l'ultra-endurance ou les pratiques sportives de pleine nature, et vous souhaitez interroger ces objets avec la rigueur des sciences humaines et sociales et la puissance des humanités numériques ? Le projet TrailCorpus-IA est fait pour vous.
Connaissance de l'objet et culture scientifique requises
Connaissance approfondie du champ scientifique du sport
Familiarité avec la littérature SHS sur le sport
Compréhension des dynamiques sociales, économiques et territoriales liées à la mondialisation des pratiques sportives
Pratique éprouvée de la publication scientifique en revues à comité de lecture
Capacité à mobiliser un cadre théorique critique
Compétences computationnelles
Programmation en Python pour la fouille de textes (spaCy, NLTK, scikit-learn ou équivalents)
Pratique d'approche de modélisation thématique (BERTopic, LDA, Gensim)
Expérience documentée d'utilisation d'API bibliographiques structurées (Crossref, OpenAlex, HAL, ou équivalent)
Capacité à concevoir des requêtes booléennes complexes et à manipuler des données semi-structurées (JSON, XML, TEI)
Maîtrise de la curation et de l'homogénéisation de sources documentaires hétérogènes
Pratique des outils de versionnage et de la documentation reproductible (Git, Jupyter)
Compétences souhaitées
Expérience personnelle, sportive ou de terrain (pratique, observation participante, ethnographie)
Familiarité avec les approches critiques en sociologie et géographie (Bourdieu, Harvey, études postcoloniales)
Connaissance des enjeux environnementaux et territoriaux liés aux sports de pleine nature
Expérience préalable d'ISTEX ou d'autres infrastructures de Text and Data Mining
Maîtrise des principes FAIR et pratique des entrepôts ouverts (Nakala, Zenodo, Software Heritage)
Compétences linguistiques additionnelles utiles pour le corpus multilingue
Langues
Maîtrise de l'anglais scientifique (lu, écrit, parlé) indispensable. Capacité à travailler sur des corpus multilingues appréciée.
Savoir-être
Rigoureux·se dans la documentation scientifique et méthodologique, autonome dans la conduite des analyses, curieux·se à l'interface entre sciences sociales du sport et humanités numériques, et diplomate dans le dialogue avec des interlocuteur·rice·s d'horizons disciplinaires variés (chercheur·e·s en SHS, ingénieur·e·s documentaires, partenaires institutionnels).
Au cœur d’une région reconnue pour sa qualité de vie, l’Université d’Angers, 3è employeur du territoire, offre un environnement propice à l’épanouissement de ses personnels et étudiants.
Elle comprend 4 Facultés, 1 IUT, 1 école d’ingénieur, 1 IAE, 1 Institut de tourisme et 31 unités et structures fédératives de recherche.
Vous vous reconnaissez dans les valeurs d’innovation, de citoyenneté, de partage et d’accompagnement de l'Université d'Angers ? Rejoignez-nous !
Vous rejoignez l'UMR ESO 6590 (Université d'Angers / CNRS) pour piloter la construction du premier corpus documentaire massif sur le trail-running et l'ultra-trail à l'échelle internationale, en partenariat étroit avec l'équipe Textes & Corpus de l'Inist-CNRS.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.