Analyse syntaxique de textes mathématiques et alignement avec des mathématiques formalisées
L'objectif de la thèse sera de concevoir et d'implémenter un analyseur syntaxique (ou « parser ») de discours afin d'analyser des documents mathématiques écrits en langue naturelle, et de produire un arbre syntaxique et logique, en s'inspirant des travaux sur la RST (Rhetorical Structure Theory) et la SDRT (Segmented Discourse Representation Theory). Il s'agira de comprendre, de manière à la fois conceptuelle et empirique, comment adapter ces outils à un texte de référence, tel que le livre d'Algèbre de Roger Godement, en français ou en anglais, ainsi qu'à un corpus de textes mathématiques bien choisi. L'un des principaux enjeux de ce travail de thèse sera de construire de manière automatique ou semi-automatique un corpus aligné entre des documents mathématiques écrits en langue naturelle et des scripts de preuve produits dans un assistant à la démonstration.
Contexte de travail
Le poste est financé par le projet ERC Synergie Malinca, et sera mené sous la direction de Benoît Crabbé et Paul-Andre Melliès. Le projet Malinca a pour objectif de participer au développement d'une nouvelle génération d'assistants à la preuve, qui intègrent dans leurs noyaux une couche linguistique et des outils d'assistance automatisée pour guider le scientifique et faciliter la construction de documents mathématiques certifiés, depuis le choix des concepts et des définitions, jusqu'à l'élaboration des théorèmes et des démonstrations.
Contraintes et risques
pas de risques ni contrainte
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.