Emploi
J'estime mon salaire
Mon CV
Mes offres
Mes alertes
Se connecter
Trouver un emploi
TYPE DE CONTRAT
Emploi CDI/CDD
Missions d'intérim Offres d'alternance
Astuces emploi Fiches entreprises Fiches métiers
Rechercher

H/f doctorant dans le cadre du projet anr vite

Montpellier
CDD
CNRS
Publiée le 12 septembre
Description de l'offre

Informations générales

Intitulé de l'offre : H/F Doctorant dans le cadre du projet ANR VITE
Référence : UMR5149-NATCOL-027
Nombre de Postes : 1
Lieu de travail : MONTPELLIER
Date de publication : vendredi 12 septembre 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 novembre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 01 - Interactions, particules, noyaux du laboratoire au cosmos

Description du sujet de thèse

La mission principale du doctorant consistera à développer, adapter et évaluer des **méthodes d’estimation de l’influence des échantillons** dans le contexte spécifique de Pl@ntNet, une plateforme dédiée à l’identification automatisée des plantes. Cette mission s’articulera autour des axes suivants :
1. Étude et adaptation des fonctions d’influence**
Le doctorant devra approfondir les **fonctions d’influence**, outils théoriques permettant de quantifier l’impact d’un échantillon sur un modèle d’apprentissage. Ces fonctions, définies à partir de la dérivée des paramètres ou de la fonction de perte par rapport à une perturbation infinitésimale du jeu de données, offrent un cadre rigoureux pour :
- **Identifier les échantillons les plus informatifs** parmi les prédictions d’un réseau de neurones profond (DNN), en vue d’améliorer l’interface utilisateur de Pl@ntNet. Actuellement, les images proposées aux utilisateurs sont sélectionnées selon une distance $\ell_2$ dans l’espace des caractéristiques. L’objectif sera de remplacer cette approche par une sélection basée sur l’influence, afin de faciliter l’identification des espèces et d’enrichir l’expérience utilisateur.
- **Détecter les erreurs d’étiquetage** dans les bases de données validées ou étiquetées par les utilisateurs, en exploitant la mesure $I_{loss}(z_i, z_i)$, qui estime l’erreur induite par la suppression d’un échantillon $z_i$ de l’ensemble d’entraînement.
- **Prioriser l’annotation des images non étiquetées**, notamment pour les espèces rares, en identifiant les échantillons dont l’ajout ou la correction aurait le plus fort impact sur la performance du modèle.

Le doctorant explorera également des **variantes avancées** des fonctions d’influence, comme l’objectif de Bregman proximal (PBO), qui permet de s’affranchir de l’hypothèse d’optimalité du modèle et d’évaluer l’influence à différents stades de l’optimisation.

2. Résolution des défis computationnels**
L’application des fonctions d’influence aux réseaux de neurones profonds se heurte à des **contraintes calculatoires**, notamment en raison de la taille prohibitive de la matrice hessienne $H_{\hat{\theta}}$. Pour y remédier, le doctorant étudiera et implémentera des **méthodes d’approximation** :
- L’utilisation de la **matrice d’information de Fisher** comme substitut à la hessienne, en s’appuyant sur des travaux récents comme ceux de @george2018fast.
- L’adoption de l’**EK-FAC (Eigenvalue-corrected Kronecker-Factored Approximate Curvature)**, une méthode efficace pour estimer la courbure de la fonction de perte, comme proposé par @grosse2023studying.
- L’exploration d’**outils d’optimisation d’ordre zéro**, tels que les extensions du lemme de Stein ou des méthodes basées sur la formule de Stokes, pour estimer la hessienne d’une fonction proxy (version lissée du réseau) en un seul passage avant (*forward pass*), comme suggéré par @balasubramanian2022zeroth.
- La combinaison de ces approches avec des techniques de **gradient naturel**, afin d’améliorer la précision et l’efficacité des estimations.

3. Prise en compte des biais d’optimisation**
Les fonctions d’influence classiques reposent sur l’hypothèse de stationnarité de la solution optimale. Or, les algorithmes de type SGD (Stochastic Gradient Descent) convergent souvent vers des points stationnaires spécifiques, influencés par des **phénomènes de biais implicite** (@chizat2020implicit, @vardi2023implicit). Le doctorant devra donc :
- **Étendre les notions d’influence** pour intégrer les propriétés dynamiques de l’algorithme d’optimisation utilisé, afin de refléter plus fidèlement l’impact réel des échantillons sur le modèle final.
- **Adapter les méthodes** pour tenir compte des spécificités de Pl@ntNet, comme la rareté de certaines espèces ou la structure hiérarchique des données.
4. Intégration et validation pratique
Enfin, le doctorant collaborera avec l’équipe Pl@ntNet pour :
Intégrer les méthodes développées dans la chaîne de traitement existante, notamment via la plateforme ThePlantGame, afin d’améliorer la qualité des annotations et l’efficacité des modèles.
Évaluer les performances des approches proposées dans des scénarios réels, en mesurant leur impact sur la précision des modèles, la détection d’erreurs et l’expérience utilisateur.

Contexte de travail

Objectif principal du projet :
Identifier les échantillons les plus influents dans un jeu de données, notamment pour Pl@ntNet, une application d’identification de plantes.
Exemples d'applications :
1. **Amélioration de l’interface utilisateur** : Actuellement, pour chaque requête, l’utilisateur voit les espèces les plus probables (5 candidates) et, parmi elles, les 5 échantillons les plus probables. L’enjeu est de proposer les échantillons les plus **informatifs** (pas seulement les plus probables) pour faciliter l’identification et améliorer l’expérience utilisateur.
2. **Amélioration théorique du modèle** : Comprendre l’influence d’un échantillon permet de détecter des erreurs d’étiquetage ou de prioriser l’étiquetage d’images non labellisées, optimisant ainsi l’algorithme d’apprentissage et la qualité du service.

Le doctorant réalisera ses travaux à l'IMAG (UMR de Mathématiques ) et au sein de l'équipe IROKO/INRIA, à Montpellier.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder
Offre similaire
Ingénieur d'étude en modélisation du fonctionnement des arbres forestiers h/f
Montpellier
CDD
CNRS
Ingénieur d'études
Offre similaire
Etude d'architectures analogiques et signaux mixtes pour l'intelligence artificielle embarquée h/f
Montpellier
CDD
CNRS
Offre similaire
Poste d'ingénieur en base de données h/f
Montpellier
CDD
CNRS
Base de Données
Voir plus d'offres d'emploi
Estimer mon salaire
JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.

Offres similaires
Recrutement CNRS
Emploi CNRS à Montpellier
Emploi Montpellier
Emploi Hérault
Emploi Languedoc-Roussillon
Intérim Montpellier
Intérim Hérault
Intérim Languedoc-Roussillon
Accueil > Emploi > H/F Doctorant dans le cadre du projet ANR VITE

Jobijoba

  • Conseils emploi
  • Avis Entreprise

Trouvez des offres

  • Emplois par métier
  • Emplois par secteur
  • Emplois par société
  • Emplois par localité
  • Emplois par mots clés
  • Missions Intérim
  • Emploi Alternance

Contact / Partenariats

  • Contactez-nous
  • Publiez vos offres sur Jobijoba
  • Programme d'affiliation

Suivez Jobijoba sur  Linkedin

Mentions légales - Conditions générales d'utilisation - Politique de confidentialité - Gérer mes cookies - Accessibilité : Non conforme

© 2025 Jobijoba - Tous Droits Réservés

Les informations recueillies dans ce formulaire font l’objet d’un traitement informatique destiné à Jobijoba SA. Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous disposez d’un droit d’accès et de rectification aux informations qui vous concernent. Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant. Pour en savoir plus, consultez vos droits sur le site de la CNIL.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder