Vos missions en quelques mots Missions : Notre projet explore l'extraction de généralisations typologiques à partir de treebanks en utilisant des approches basées token-based (Levshina 2019) ou typométriques (Gerdes, Kahane et Chen 2021). L’objectif de la mission est la création d'une base de données typologique. Cette base de données intégrera des données quantitatives issues des treebanks des 180 langues du projet Universal Dependency). Notre objectif est de capturer tout le spectre de la diversité linguistique et de générer des généralisations typologiques quantitatives et nuancées basées sur les structures annotées, ce qui pourrait éventuellement conduire à des grammaires comparatives automatisées. La mission est financée par le projet de recherche ANR Autogramm (https://autogramm.github.io/). Autogramm se concentre sur l'exploration du potentiel des treebanks annotés en dépendances pour élucider les structures de langues sous-représentées et typologiquement diverses. Le chercheur postdoctoral nommé sera affilié au laboratoire Modyco (Université Paris Nanterre) intégrant les collaborations en cours autour de Paris, en particulier avec le laboratoire Lacito (Paris/Villejuif) et le laboratoire LISN (Université Paris-Saclay). La base de données typologique sera construite en collaboration avec un chercheur et un ingénieur de l’INRIA Paris Est. Activités : La personne recrutée devra spécifier les caractéristiques d'une base de données quantitative en se basant sur les études typologiques faites à partir de treebanks. Elle devra proposer un certain nombre d'études potentiellement réalisables à partir de la base de données Universal Dependencies afin de paramétrer la génération de la base de données. Contexte de travail : La personne recrutée sera placée sous l'autorité hiérarchique de M. Sylvain Kahane. Elle interagira avec les membres de l'ANR Autogramm, notamment Bruno Guillaume (INRIA Grand Est), Kim Gerdes (LISN) et Sylvain Loiseau (Lacito), ainsi qu'avec les membres de Modyco impliqués dans le projet (1 chercheur, 3 enseignants-chercheurs et 3 doctorants). Le poste de travail se situe dans les locaux de Modyco sur le campus de l'Université Paris Nanterre, accessible par le RER A et la ligne L. Le compus possède un restaurant du personnel. Profil recherché Competences : - Connaissance en typologie des langues et plus particulièrement en typologie quantitative et token-based typology. - Connaissance des schémas d'annotation Universal Dependencies (UD) ou Surface-syntactic UD (SUD) - Connaissance de l'outil Grew-match pour requêter des treebanks Contraintes et risques : Niveau d'études minimum requis Niveau Niveau 8 Doctorat/diplômes équivalents Spécialisation Formations générales Langues Français Seuil
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.