Mission :
Dans le cadre du projet ANR AI-WOOD, des chercheurs du CEPAM, du laboratoire i3S et du Centre INRIA Université Côte d'Azur collaborent au développement de nouvelles approches d'apprentissage profond visant à réaliser l'identification taxonomique (c'est-à-dire la classification au niveau de l'espèce, du genre ou de la famille) du bois et du charbon de bois à partir d'images microscopiques en 2D. Le projet a un intérêt principal d'un point de vue archéologique, l'idée principale étant d'entraîner un classificateur pour l'identification des espèces et des familles sur une collection moderne (environ 6000 images pour 120 espèces) et de l'utiliser ensuite pour identifier des charbons de bois anciens.
Les anthracologues (c.-à-d. les archéologues spécialisés dans l'identification et l'analyse des charbons de bois anciens) effectuent cette identification en s'appuyant sur l'anatomie comparée et sur les caractéristiques anatomiques établies par l'IAWA qu'ils construisent manuellement par observation microscopique. Outre le fait qu'elle est longue et fastidieuse, cette routine d'identification n'est pas entièrement satisfaisante, (aussi) en raison de la proximité anatomique de certaines essences.
Le but de ce projet est donc d'explorer le potentiel de l'apprentissage profond pour identifier directement le taxon d'un spécimen à partir de l'observation microscopique et éventuellement d'améliorer la routine d'identification. Bien que certaines tentatives dans ce sens ont été faites dans la littérature (Rosa da Silva et al., 2022 ; Silva et al., 2022), il y a encore une marge d'amélioration considérable. Un doctorant a mis en place un modèle d'apprentissage profond permettant d'obtenir une précision de l'ordre de 80 % sur 4 classes pour lesquelles nous disposons de suffisamment de données. Le doctorant travaille sur plusieurs problématiques : la résolution des images, la fusion des coupes, les hiérarchies de classes (famille, genre, espèce) ainsi que de l'utilisation de connaissances expertes des anthracologues. La base de donnée actuelle présente de nombreuses classes mais dont le remplissage est très variable : de nombreuses classes ne présentent des données que pour très peu d'individus. L'axe principal de travail de ce poste d'ingénieur concernera l'étude de l'apprentissage avec peu de données.
Activités :
Ce poste comportera différentes étapes :
- étude de l'état de l'art de l'apprentissage avec peu de données,
- étude des codes existants et test sur les données des anthracologues,
- codage éventuel des algorithmes dont le code n'est pas disponible,
- comparaison des différentes approches,
- contribution au domaine.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.