Description
du poste :
Vous êtes encadré(e) par un chercheur de l’équipe Getalp ou MRIM (Laboratoire d’Informatique de Grenoble), ainsi que par le Directeur Scientifique Traitement Automatique des Langues de Probayes.
Vous travaillez à l’extension des méthodes de RAG (retrieval-augmented generation) grâce aux données structurées.
Un système RAG permet l’interrogation en langage naturel d’une base de documents :
1. Les documents sont découpés et indexés dans une base de données vectorielles
2. La requête utilisateur est rapprochée des passages indexés, et les passages les plus proches sont remontés
3. Un LLM (grand modèle de langue) génère la réponse à la question à partir des passages pertinents.
Plusieurs structures peuvent être extraites d’une base documentaire :
4. La structure interdocuments
5. La structure intradocument
6. Des structure sémantiques, entre concepts présents dans les documents
Dans cette thèse, nous proposons d’exploiter ces structures pour améliorer :
7. La compréhension et le nettoyage de la base documentaire
8. La récupération des passages pertinents
9. La génération de réponses pertinentes et leur justification
La recherche pourra s’appuyer sur :
10. Des déploiement industriels de RAG existant chez Probayes, incluant des jeux de données, bancs d’essais, tests utilisateurs et moyens de calcul
11. L’état de l’art de la recherche d’information et de l’exploitation de structure parmi les travaux récents de Getalp et MRIM.
La thèse se déroulera à Grenoble, en alternance dans les bureaux de Probayes (Montbonnot) et au sein du LIG (Campus de Saint Martin d’Hères).
Funding category
Cifre
Funding further details
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.