L’Anses recrute un Chargé de projet recherche en apprentissage et traitement automatique des langues (H/F) Poste basé à Maisons-Alfort (94) - CDD de 12 mois Vos missions Vous participerez au projet de recherche SafeFood4ClimDiet coordonné par l’Anses, en collaboration avec l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE). Ce projet a pour objectif d’identifier les risques microbiologiques associés aux nouvelles pratiques alimentaires influencées par le dérèglement climatique. Il vise en particulier à identifier les pratiques alimentaires par le développement de méthodes de traitement automatique des langues. Vous aurez pour objectif de développer une méthode originale de reconnaissance d’entités nommées (NER) en français et en anglais, fonctionnant en zero-shot learning, c’est-à-dire sans nécessiter de données d’entraînement annotées manuellement. L’approche envisagée est de s’appuyer sur les grands modèles de langue (LLMs) en mode conversationnel (“hard prompting”), tirant parti des connaissances latentes qu’ils ont acquises lors de leur pré-entraînement sur de vastes corpus textuels. La méthode sera évaluée sur des jeux de données standard en reconnaissance d’entités (tels que NCBI Disease Corpus, FoodBase corpus), tout en étant optimisée pour identifier a minima deux types d’entités spécifiques : les concepts environnementaux (ex : " carbon footprint ", " biodiversity loss ", " environmental concern ") et ceux en lien avec les comportements de consommation alimentaire (ex : noms d’aliments " apple ", méthodes de production " organic food " ou encore relatives à des pratiques dites durables " composting food waste "). Votre équipe A l’Anses, la Direction de l’évaluation des risques (DER) assure l’ensemble des missions d’évaluation dans le domaine des bénéfices et des risques nutritionnels et sanitaires liés à l’alimentation, des risques liés à la santé-environnement, des risques liés à la santé au travail, des risques liés à la santé, à l’alimentation et au bien-être des animaux, et des risques liés à la santé des végétaux. Au sein de cette direction, l’Unité « évaluation des risques liés aux aliments » (UERALIM) a pour mission principale la coordination des travaux de collectifs d’experts pour l’évaluation des risques sanitaires liés à la présence de contaminants biologiques ou chimiques dans les aliments, sous la responsabilité d’un chef d’unité et d’un adjoint. Elle contribue à la communication scientifique des produits de l’expertise et présente l’activité scientifique de l’unité auprès des instances nationales ou communautaires. Elle collabore avec les autres directions et les laboratoires de l’Agence. Elle participe à des projets de recherche nationaux ou internationaux. Vous rejoindrez une équipe de 15 personnes. Le projet de recherche implique une collaboration avec l’unité de recherche MaIAGE (« Mathématiques et Informatique Appliquées du Génome à l’Environnement ») de l’INRAE, située à Jouy-en-Josas (78), qui développe des méthodes mathématiques et informatiques originales de portée générique ou motivées par des problèmes biologiques précis. L’équipe de recherche Bibliome développe des méthodes d’extraction d’information (text mining) à partir de textes, notamment dans les domaines des sciences du vivant (bioNLP). Vos missions Développer une méthode originale de reconnaissance d’entités basée sur des LLMs, fonctionnant en zero-shot learning Mettre en place une évaluation rigoureuse en comparant la méthode aux approches de l’état de l’art sur des jeux de données standard de reconnaissance d’entités Appliquer la méthode pour la détection des entités d’intérêt pour le projet, sur un corpus non-annoté en français et en anglais, pour proposer des tendances alimentaires émergentes à d’autres acteurs du projet ANR. Le corpus sera composé de documents en science de la vie et en science sociale (publications scientifiques, articles de journaux) Analyser le corpus du projet : annotation manuelle de quelques documents, mise en place d’une méthode baseline de reconnaissance d’entité à des fins de comparaison, et analyse d’erreurs Collaborer avec les autres chercheurs du projet (informaticiens, microbiologistes et sociologues) et contribuer aux livrables scientifiques Votre profil Formation et expérience requises : BAC 3 minimum Doctorat en Informatique, en Traitement Automatique des Langues naturelles (TAL), Text-mining ou discipline connexe souhaité. Une première expérience similaire à l’une ou plusieurs des missions décrites sera appréciée. Compétences : Maîtrise pratique des grands modèles de langue (LLMs) et utilisation par API Maîtrise de la programmation Python Expérience en évaluation de modèles Capacité à travailler en mode projet, rigueur, organisation et planification Maîtrise de l’anglais scientifique et technique (écrit et oral) Expérience ou intérêt marqué pour la recherche interdisciplinaire, notamment avec les sciences du vivant (ex : sciences des aliments, microbiologie) Connaissance des principes d’ingénierie des connaissances, et en particulier des ontologies, serait un plus L’Anses recrute, accompagne et valorise les talents dans leur diversité pour s’engager au service de la santé publique. Rejoignez-nous !
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.