Publiée le 18 juin
Mission du poste
Informations générales Organisme de rattachement CNRS Référence UMR6072-CELALE-001 Date de début de diffusion 16/06/2026 Date de parution 17/06/2026 Date de fin de diffusion 07/07/2026 Intitulé long de l'offre Post-doctorat : LLM et Ontologies - Génération Itérative Contrôlée (H/F) Date limite de candidature 07/07/2026 Nature du contrat CDD de 2 ans Versant Fonction Publique de l'Etat Catégorie Catégorie A (cadre) Nature de l'emploi Emploi ouvert uniquement aux contractuels Domaine / Métier Recherche - Chercheuse / Chercheur Statut du poste Vacant Intitulé du poste Post-doctorat : LLM et Ontologies - Génération Itérative Contrôlée (H/F) Descriptif de l'employeur Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique. Description du poste Missions : La personne recrutée aura pour mission principale de concevoir et développer de nouvelles approches d'Intelligence Artificielle Générative pour le peuplement d'ontologies à partir de textes complexes. Dans le cadre du projet LOGIC, l'agent devra hybrider la puissance des Grands Modèles de Langage (LLM) avec la rigueur du Web Sémantique afin de dépasser les limites des méthodes d'ingénierie de prompts statiques. L'objectif central est de mettre en place une approche de "génération itérative contrôlée", où une ontologie formelle agit comme une fonction de perte sémantique pour guider et corriger les LLM. Activités : - Concevoir et implémenter un mécanisme d'optimisation automatique de prompts intégrant une boucle de rétroaction pilotée par un raisonneur logique formel. - Développer des méthodes pour extraire et modéliser des structures complexes et des relations n-aires (ex: crénaux horaires, distances, fermetures dépendantes) selon les standards du Web Sémantique (schémas OWL). - Concevoir un module d'évaluation automatisé permettant d'aligner et de comparer les prédictions générées avec la vérité terrain (par exemple en utilisant une approche de type « LLM juge »). - Exploiter, tester et comparer plusieurs Grands Modèles de Langage (LLM open-source ou propriétaires). - Rédiger des articles scientifiques et présenter les résultats obtenus dans des conférences et journaux internationaux de premier plan. - Participer ponctuellement à la vie scientifique de l'équipe (réunions de projet, séminaires). Contexte de travail : Le poste est à pourvoir au sein du laboratoire GREYC (UMR 6072 - CNRS, Université de Caen Normandie, ENSICAEN). La personne recrutée sera affectée sur le Campus 2, à Caen (Normandie, France), et intégrera l'équipe de recherche CODAG (Contraintes, Ontologies, Données, Annotations, Graphes). Ces travaux s'inscrivent dans le cadre du projet régional émergent « LOGIC » (LLM et Ontologies : Génération Itérative Contrôlée), financé par la Région Normandie et coordonné par Céline ALEC. Conditions particulières d'exercice Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche. Descriptif du profil recherché Competences : - Expertise scientifique : Solides connaissances en Ingénierie des Connaissances / Web Sémantique (Ontologies, RDF, OWL, moteurs d'inférence) et en Traitement Automatique des Langues (TAL) moderne (manipulation de LLM). - Programmation : Excellente maîtrise des langages Python et/ou Java, ainsi que des bibliothèques associées au TAL et au Web Sémantique. - Savoir-être et recherche : Rigueur scientifique, forte autonomie, esprit d’initiative et capacité démontrée à publier dans des actes et revues de rang international. Contraintes et risques : Temps plein Oui Rémunération contractuels (en € brut/an) 3 000 € et 3 600 € bruts / mois selon expérience Localisation du poste Europe, France, Normandie, Calvados (14) Géolocalisation du poste CAEN Lieu d'affectation (sans géolocalisation) 14032 CAEN (France) Critères candidat Niveau d'études / Diplôme Niveau 8 Doctorat/diplômes équivalents Spécialisation Formations générales Langues Français (Seuil)