Topic description
Les plateformes de science citoyenne dédiées à la surveillance de la biodiversité créent une boucle de rétroaction
entre les modèles d'apprentissage automatique déployés et les données soumises par les utilisateurs : les
prédictions de la plateforme influencent le comportement des utilisateurs, qui à son tour influence la distribution d'apprentissage des futurs modèles.
Ce phénomène, connu sous le nom de *prédiction performative*, pose des défis fondamentaux à la théorie de l'apprentissage statistique. Les cadres existants traitent principalement de la régression et de la classification binaire sous des hypothèses structurelles restrictives, laissant largement de côté les régimes multi-classes, à déséquilibre de classes et à longue traîne qui caractérisent les ensembles de données réels sur la biodiversité.
Ce projet propose d'étendre la théorie et les algorithmes d'apprentissage performatif à ces contextes, en mettant particulièrement l'accent sur la modélisation du mécanisme de rétroaction de la science citoyenne et sur le développement de méthodes basées sur les gradients, qui restent pratiques dans le cadre de contraintes de déploiement réalistes.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Citizen science platforms for biodiversity monitoring create a feedback loop between deployed machine learning models and the data users submit: platform predictions shape user behavior, which in turn shapes the training distribution
of future models.
This phenomenon, known as performative prediction, poses fundamental challenges for statistical learning theory. Existing frameworks address primarily regression and binary classification under restrictive structural assumptions, leaving the multi-class, class-imbalanced, and long-tail regimes that characterize real biodiversity datasets largely unaddressed.
This project proposes to extend performative learning theory and algorithms to these settings, with a particular focus on modeling the citizen science feedback mechanism and developing gradient-based methods that remain practical under realistic deployment constraints.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/
Funding category
Public funding alone (i.e. government, region, European, international organization research grant)
Funding further details
Concours pour un contrat doctoral
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.