Topic description
La thèse s'inscrit à l'interface des probabilités et de la statistique. Les questions étudiées sont motivées par des applications réelles issues d'un projet INSERM (HisToGraM). Les données proviennent de l'étude de tissus observés à différentes échelles et peuvent être représentées sous la forme de nuages de points dans le plan, chaque point correspondant à une entité caractérisée par diverses propriétés ou marques; par exemple, le type, la morphologie ou le transcriptome d'une cellule. Pour une condition
donnée, on suppose que les données suivent la loi d'un processus ponctuel marqué, dont les paramètres varient selon la condition étudiée. Le problème central consiste alors à distinguer, d'un point de vue statistique, plusieurs processus ponctuels marqués et à identifier les statistiques discriminantes les plus pertinentes. Ces statistiques sont construites à partir de graphes associés aux processus ponctuels. Les tests seront élaborés à partir de théorèmes limites de deux natures: en régime normal (théorèmes limites centraux) et en
régime poissonien (étude d'extrêmes). L'approche pourra également être complétée en établissant des inégalités de concentration et des résultats de grandes déviations.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
This PhD thesis lies at the interface between probability theory and statistics. The questions addressed are motivated by real-world applications arising from an INSERM project (HisToGraM). The data originate from the study of
tissues observed at multiple scales and can be represented as point clouds in the plane, each point corresponding to an entity characterized by various properties or marks—for example, the type, morphology, or transcriptomic profile of a cell. For a given condition, the data are assumed to follow a marked point process whose parameters vary with the condition under study. The central problem is therefore to statistically distinguish between several marked point processes and to identify the most relevant discriminating statistics. These statistics are constructed from graphs associated with the underlying point processes. The statistical tests will be developed using two types of limit theorems: asymptotic results in the Gaussian regime (central limit theorems) and in the Poisson regime (extreme-value analysis). The approach may also be complemented by establishing concentration inequalities and large deviation principles.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/09/
Funding category
Funding further details
Financement d'un établissement public Français
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.