Il s'agit d'un poste de doctorat à temps plein dans le cadre d'un programme industriel CIFRE conjointement mené par Stellantis et l'École Polytechnique (France).
La recherche porte sur les modèles de monde réactifs et contrôlables capables de générer des vidéos à long horizon dans un cadre en flux continu et en boucle fermée. Le travail se situe à l'intersection de la modélisation vidéo générative, des modèles de monde et de la simulation interactive en temps réel en vision par ordinateur, avec la conduite autonome comme principal domaine d'application.
Les progrès récents dans la génération de vidéos à grande échelle et les modèles de monde ont montré que les réseaux neuronaux peuvent apprendre des simulateurs visuels riches et contrôlables de données réelles. Cependant, la plupart des modèles existants fonctionnent hors ligne : ils génèrent des séquences courtes à partir d'un point de vue unique, sans cohérence temporelle à long terme ni capacité de réaction aux actions de l'agent en temps réel.
Ce doctorat vise à faire progresser les modèles vidéo génératifs vers un régime où ils se comportent comme des simulateurs de monde réactifs, produisant des sorties cohérentes dans le temps qui répondent aux actions de contrôle à la volée, avec un comportement cohérent entre les points de vue si nécessaire.
Objectifs principaux :
- Construire des modèles génératifs de monde capables de produire des vidéos photoréalistes à long horizon des environnements de conduite, avec une dynamique cohérente dans le temps et entre différents points de vue.
- Aller au-delà de la synthèse vidéo hors ligne vers une génération réactive en boucle fermée.
- Étudier comment rendre les mondes générés contrôlables et diversifiés.
- Connecter les modèles aux pipelines de conduite autonome pour l'entraînement et l'évaluation.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.