Une première partie du projet MeSMRise se concentrera sur l'apprentissage de représentations (multimodales) et de graphes d'interactions structurés par des actions. Alors que des politiques d'action aléatoires ou naïves peuvent être utilisées pour cela, des manipulations dirigées devraient être plus efficaces pour l'apprentissage de représentations d'objets.
Le/la candidat(e) se concentrera donc sur l'apprentissage de politiques d'action et abordera les principales questions suivantes : - Comment apprendre de manière non supervisée à sélectionner des actions qui conduiront à de meilleures représentations ? Nous considérerons le cadre de l'apprentissage de la manipulation active d'objets et explorerons l'utilisation d'impulsions intrinsèques dérivées des pertes SSL pour apprendre des politiques de manipulation. - Comment apprendre des politiques hiérarchiques pour la manipulation d'objets en utilisant les pertes SSL comme moteurs d'apprentissage actif ? Nous étudierons l'impact de l'accès à ces différents niveaux d'actions dans un cas de politique hiérarchique - Comment exploiter les graphes d'anticipations appris pour guider l'apprentissage de politiques efficaces ? Nous étudierons également comment exploiter au mieux les informations d'inférence fournies par les anticipations apprises d'autres WP pour guider davantage l'apprentissage de l'agent. En effet, les représentations abstraites (par exemple, les primitives sensorimotrices) et les inférences de plus haut niveau dans les environnements non markoviens peuvent être utilisées pour une planification optimale des actions (par exemple, en utilisant l'algorithme de recherche heuristique informée D*), des augmentations de structure (par exemple, pour lier plusieurs petites rotations comme une manipulation à plus grande échelle d'un seul objet). Ceci peut être utilisé pour sélectionner le meilleur plan d'action, afin d'optimiser l'exploitation (par exemple pour la distinguabilité) ou l'exploration (par exemple en biaisant les mécanismes de curiosité). Enfin, le/la candidat'e) devra contribuer à la coordination avec les autres tâches et partenaires du projet.
Activités
- Proposer différentes stratégies et architectures d'apprentissage de politique
- Évaluer ces stratégies en utilisant un environnement robotique 3D simulant la manipulation d'objets 3D
- Rédiger des articles scientifiques
- Coordonner avec les autres partenaires du projet et contribuer à l'intégration.
Compétences
Le/la candidat(e) idéal(e) est titulaire d'un doctorat dans un domaine pertinent et a :
- une solide expérience et des publications dans le domaine de l'apprentissage automatique, en particulier l'apprentissage profond et l'apprentissage par renforcement pour la manipulation et la perception d'objets.
- Une expérience de l'apprentissage actif, des motivations intrinsèques et/ou de l'apprentissage auto-supervisé est fortement souhaitée.
- Expérience avec des simulateurs de robotique 3D
- Capacité à interagir de manière fluide avec les différents membres du consortium ;
- Autonomie et proactivité dans les activités de recherche et les rapports d'activité
Contexte de travail
Ce poste postdoctoral s'inscrit dans le projet ANR MeSMRise (Multimodal deep SensoriMotor Representation learning) (https://projet.liris.cnrs.fr/mesmrise/index.html).
Le projet MeSMRise propose de s'inspirer de la façon dont les bébés humains apprennent à explorer leur environnement à travers des actions qui façonnent leur expérience multimodale. Inspiré par la théorie des contingences sensorimotrices (SMC), l'objectif principal du projet est d'étudier comment l'action peut structurer les représentations multimodales, apprises avec des méthodes d'apprentissage auto-supervisé (SSL). Ceci sera appliqué à des objets 3D, perçus par vision et nuage de points, et manipulés dans des environnements virtuels.
Ce post-doctorat s'inscrit dans le troisième workpackage du projet relatif à l'apprentissage actif, se concentrant sur l'apprentissage de politiques d'action qui permettent un apprentissage efficace des représentations d'objets.
Le/la candidat(e) travaillera à l'Institut Pascal, à proximité de Clermont-Ferrand, et interagira avec d'autres partenaires du projet à Lyon et à Grenoble.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Ce poste postdoctoral s'inscrit dans le projet ANR MeSMRise (Multimodal deep SensoriMotor Representation learning) (https://projet.liris.cnrs.fr/mesmrise/index.html).
Le projet MeSMRise propose de s'inspirer de la façon dont les bébés humains apprennent à explorer leur environnement à travers des actions qui façonnent leur expérience multimodale. Inspiré par la théorie des contingences sensorimotrices (SMC), l'objectif principal du projet est d'étudier comment l'action peut structurer les représentations multimodales, apprises avec des méthodes d'apprentissage auto-supervisé (SSL). Ceci sera appliqué à des objets 3D, perçus par vision et nuage de points, et manipulés dans des environnements virtuels.
Ce post-doctorat s'inscrit dans le troisième workpackage du projet relatif à l'apprentissage actif, se concentrant sur l'apprentissage de politiques d'action qui permettent un apprentissage efficace des représentations d'objets.
Le/la candidat(e) travaillera à l'Institut Pascal, à proximité de Clermont-Ferrand, et interagira avec d'autres partenaires du projet à Lyon et à Grenoble.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Contraintes et risques
RAS
RAS
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.