Informations générales
Organisme de rattachement
CNRS
Référence
UMR7114-SYLKAH-001
Date de début de diffusion
/01/2026
Date de parution
/01/2026
Date de fin de diffusion
/02/2026
Versant
Fonction Publique de l'Etat
Catégorie
Catégorie A (cadre)
Nature de l'emploi
Emploi ouvert uniquement aux contractuels
Domaine / Métier
Recherche - Chercheuse / Chercheur
Statut du poste
Vacant
Intitulé du poste
chercheur H/F typologie quantitative
Descriptif de l'employeur
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l'Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d'éthique, de déontologie et d'intégrité scientifique.
Description du poste
Missions :
Notre projet explore l'extraction de généralisations typologiques à partir de treebanks en utilisant des approches basées token-based (Levshina 2019) ou typométriques (Gerdes, Kahane et Chen L'objectif de la mission est la création d'une base de données typologique. Cette base de données intégrera des données quantitatives issues des treebanks des 180 langues du projet Universal Dependency). Notre objectif est de capturer tout le spectre de la diversité linguistique et de générer des généralisations typologiques quantitatives et nuancées basées sur les structures annotées, ce qui pourrait éventuellement conduire à des grammaires comparatives automatisées. La mission est financée par le projet de recherche ANR Autogramm ). Autogramm se concentre sur l'exploration du potentiel des treebanks annotés en dépendances pour élucider les structures de langues sous-représentées et typologiquement diverses. Le chercheur postdoctoral nommé sera affilié au laboratoire Modyco (Université Paris Nanterre) intégrant les collaborations en cours autour de Paris, en particulier avec le laboratoire Lacito (Paris/Villejuif) et le laboratoire LISN (Université Paris-Saclay). La base de données typologique sera construite en collaboration avec un chercheur et un ingénieur de l'INRIA Paris Est .
Activités :
La personne recrutée devra spécifier les caractéristiques d'une base de données quantitative en se basant sur les études typologiques faites à partir de treebanks. Elle devra proposer un certain nombre d'études potentiellement réalisables à partir de la base de données Universal Dependencies afin de paramétrer la génération de la base de données.
Contexte de travail :
La personne recrutée sera placée sous l'autorité hiérarchique de M. Sylvain Kahane. Elle interagira avec les membres de l'ANR Autogramm, notamment Bruno Guillaume (INRIA Grand Est), Kim Gerdes (LISN) et Sylvain Loiseau (Lacito), ainsi qu'avec les membres de Modyco impliqués dans le projet (1 chercheur, 3 enseignants-chercheurs et 3 doctorants). Le poste de travail se situe dans les locaux de Modyco sur le campus de l'Université Paris Nanterre, accessible par le RER A et la ligne L. Le compus possède un restaurant du personnel.
Conditions particulières d'exercice
Le Centre national de la recherche scientifique est l'une des plus importantes institutions publiques au monde : femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l'Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l'international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l'innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
Descriptif du profil recherché
Competences :
- Connaissance en typologie des langues et plus particulièrement en typologie quantitative et token-based typology.
- Connaissance des schémas d'annotation Universal Dependencies (UD) ou Surface-syntactic UD (SUD)
- Connaissance de l'outil Grew-match pour requêter des treebanks
Contraintes et risques :
Temps plein
Oui
Rémunération contractuels (en € brut/an)
comprise entre 3 131, 32€ et 4 395,65 € bruts mensuels selon selon expérience
Localisation du poste
Europe, France, Île-de-France, Hauts-de-Seine (92)
Géolocalisation du poste
NANTERRE
Lieu d'affectation (sans géolocalisation)
92001 NANTERRE (France)
Critères candidat
Niveau d'études / Diplôme
Niveau 8 Doctorat/diplômes équivalents
Spécialisation
Formations générales
Langues
Français (Seuil)
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.