Le travail proposé pour ce post-doctorat porte sur la prédiction structurée multilingue. Il s'agit d'extraire des graphes de connaissances à partir de textes qui sont rédigés en différentes langues. En effet, les modèles existants sont souvent entraînés et testés principalement en monolingue. L'objectif du post-doctorat est double. Dans un premier temps, il s'agira de développer des méthodes pour extraire des graphes de connaissances à partir de textes écrits en différentes langues. Dans un second temps, on cherchera à utiliser ces méthodes pour mesurer la factualité (cohérence sémantique) entre deux textes, en monolingue ou en multilingue.
Activités
Les activités prévues sont les suivantes :
- Revue de la litérature scientifique sur la prédiction structurée et la factualité
- Proposition d'un modèle neuronal pour la prédiction structurée multilingue
- Apprentissage du modèle sur des données (texte, graphe) créées par apprentissage distant à partir
des textes Wikipedia et de la base de connaissances Wikidata.
- Création de jeux de test (texte, graphe) multilingue
- Evaluation du modèle sur ce jeu de test
- Apprentissage d'une métrique de similarité pour les graphes de connaissance
- Application de cette métrique pour mesurer la factualité d'un texte par rapport à un autre texte (par exemple, pour mesurer la factualité d'un résumé par rapport au document source).
Compétences
- Solides connaissances des fondements mathématiques et informatiques des méthodes neuronales
- Compétence forte en informatique notamment implémentation de modèles neuronaux (pytorch)
- Anglais courant
- Expérience dans le domaine du Traitement Automatique des Langues
Contexte de travail
La personne recrutée travaillera sous la supervision de Claire Gardent, Directrice de Recherche (Classe Exceptionnelle) CNRS au LORIA (Laboratoire Lorrain de recherche en informatique et ses applications). Elle bénéficiera de l'environnement de recherche du LORIA et de l'équipe MosAIk, une équipe à l'interface entre Intelligence Artificielle, Traitements automatique des langues et Connaissances.
Contraintes et risques
N/A
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.