Publiée le 18 juin
Mission du poste
Vos missions en quelques mots Missions : La personne recrutée aura pour mission principale de concevoir et développer de nouvelles approches d'Intelligence Artificielle Générative pour le peuplement d'ontologies à partir de textes complexes. Dans le cadre du projet LOGIC, l'agent devra hybrider la puissance des Grands Modèles de Langage (LLM) avec la rigueur du Web Sémantique afin de dépasser les limites des méthodes d'ingénierie de prompts statiques. L'objectif central est de mettre en place une approche de "génération itérative contrôlée", où une ontologie formelle agit comme une fonction de perte sémantique pour guider et corriger les LLM. Activités : - Concevoir et implémenter un mécanisme d'optimisation automatique de prompts intégrant une boucle de rétroaction pilotée par un raisonneur logique formel. - Développer des méthodes pour extraire et modéliser des structures complexes et des relations n-aires (ex: crénaux horaires, distances, fermetures dépendantes) selon les standards du Web Sémantique (schémas OWL). - Concevoir un module d'évaluation automatisé permettant d'aligner et de comparer les prédictions générées avec la vérité terrain (par exemple en utilisant une approche de type « LLM juge »). - Exploiter, tester et comparer plusieurs Grands Modèles de Langage (LLM open-source ou propriétaires). - Rédiger des articles scientifiques et présenter les résultats obtenus dans des conférences et journaux internationaux de premier plan. - Participer ponctuellement à la vie scientifique de l'équipe (réunions de projet, séminaires). Contexte de travail : Le poste est à pourvoir au sein du laboratoire GREYC (UMR 6072 - CNRS, Université de Caen Normandie, ENSICAEN). La personne recrutée sera affectée sur le Campus 2, à Caen (Normandie, France), et intégrera l'équipe de recherche CODAG (Contraintes, Ontologies, Données, Annotations, Graphes). Ces travaux s'inscrivent dans le cadre du projet régional émergent « LOGIC » (LLM et Ontologies : Génération Itérative Contrôlée), financé par la Région Normandie et coordonné par Céline ALEC. Profil recherché Competences : - Expertise scientifique : Solides connaissances en Ingénierie des Connaissances / Web Sémantique (Ontologies, RDF, OWL, moteurs d'inférence) et en Traitement Automatique des Langues (TAL) moderne (manipulation de LLM). - Programmation : Excellente maîtrise des langages Python et/ou Java, ainsi que des bibliothèques associées au TAL et au Web Sémantique. - Savoir-être et recherche : Rigueur scientifique, forte autonomie, esprit d’initiative et capacité démontrée à publier dans des actes et revues de rang international. Contraintes et risques : Niveau d'études minimum requis Niveau Niveau 8 Doctorat/diplômes équivalents Spécialisation Formations générales Langues Français Seuil