Topic description
Cette thèse s'inscrit dans le cadre de la chaire BALTEEC, financée par le Cluster MIAI.
L'apprentissage actif bayésien (BAL) est un cadre efficace pour l'apprentissage des paramètres
d'un modèle, dans lequel les stimuli d'entrée sont sélectionnés de manière à maximiser
l'information mutuelle entre les observations et les paramètres inconnus. L'utilisation d'une
stratégie BAL permet généralement de réduire de façon drastique la quantité de données
(mesures et/ou simulations) nécessaires pour produire des prédictions fiables, réduisant ainsi les
coûts associés (temps de calcul, espace mémoire..).
Bien qu'il existe maintenant une vaste littérature sur le sujet, les travaux se concentrent sur des
modèles prenant en entrée des variables de même nature (données vectorielles, images,
graphes…). L'objectif de cette thèse est de développer des approches qui s'appliquent dans des
contextes plus généraux, où le modèle prend en entrée des variables mixtes (à la fois des
variables discrètes et des variables continues), des séries temporelles souvent fortement
corrélées, des données présentant une structure de dépendance en arbre… Dans un contexte
d'apprentissage actif bayésien, il est possible de choisir un a priori gaussien, caractérisé par sa
moyenne et sa structure de covariance, définie par un noyau. Le choix du noyau doit permettre
une bonne exploration de l'espace des variables d'entrée. Un effort important sera mis sur la
construction de noyaux adaptés à des variables complexes telles que décrites ci-dessus, et sur le
développement et l'implémentation d'algorithmes d'optimisation sur un espace non euclidien.
Ces algorithmes feront appel à des techniques d'optimisation en nombres entiers mixtes. Ces
résultats seront appliqués au suivi énergétique des bâtiments pour l'amélioration de leur
performance énergétique. Cela inclut l'audit énergétique avant rénovation (apprentissage du
comportement réel sur la base de mesures in situ), l'optimisation de cette rénovation sur des
critères de consommations et de confort, et la vérification de la performance. Les données
disponibles dans le suivi des bâtiments sont les données météorologiques, les propriétés
énergétiques des constructions, et les informations d'occupation.
Mots clés :apprentissage actif, incertitudes, optimisation,plans d'expériences, audit énergétique
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
This thesis is part of the BALTEEC Chair, funded by the MIAI Cluster. Bayesian active learning
(BAL) is an efficient framework for learning model parameters, in which input stimuli are selected
so as to maximise the mutual information between the observations and the unknown parameters.
The use of a BAL strategy generally makes it possible to drastically reduce the amount of data
(measurements and/or simulations) required to produce reliable predictions, thereby reducing the
associated costs (computing time, memory space, etc.).
Although there is now a vast literature on the subject, work has focused on models taking as input
variables of the same nature (vector data, images, graphs, etc.). The aim of this thesis is to
develop approaches that can be applied in more general contexts, where the model takes as input
mixed variables (both discrete and continuous variables), time series that are often highly
correlated, tree-structured data, etc. In a Bayesian active learning context, it is possible to choose
a Gaussian a priori, characterised by its mean and its covariance structure, defined by a kernel.
The choice of kernel must allow a good exploration of the space of input variables. A major effort
will be made to construct kernels adapted to complex variables such as those described above,
and to develop and implement optimisation algorithms on a non-Euclidean space.
These algorithms will use mixed integer optimisation techniques. These results will be applied to
the energy monitoring of buildings to improve their energy performance. This includes energy
performance diagnostics prior to renovation (learning about actual heat dynamics from in situ
measurements), the optimisation of renovation with objectives of consumption and comfort criteria,
and the verification of performance. Building monitoring data includes weather data, envelope and
HVAC properties, and occupancy schedules.
Key words: active learning, uncertainty quantification, optimisation, experimental design, energy
audit
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/
Funding category
Funding further details
Autres financements
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.