Emploi
Assistant de carrière BÊTA J'estime mon salaire
Mon CV
Mes offres
Mes alertes
Se connecter
Trouver un emploi
TYPE DE CONTRAT
Emploi CDI/CDD
Missions d'intérim Offres d'alternance
Astuces emploi Fiches entreprises Fiches métiers
Rechercher

Thèse cifre /phd - apprentissage par renforcement multimodal pour la robotique (m/f)

Toulouse
Alternance
3510 AIRBUS SAS
Publiée le Il y a 10 h
Description de l'offre

Description de l'emploi:

Airbus Commercial Aircraft recherche un(e) étudiant(e) en thèse sur le sujet: “Apprentissage par Renforcement Multimodal pour la Robotique (M/F)” pour rejoindre le département Central Research & Technology, Airbus SAS basé àToulouse, France.

Le département travaille en collaboration avec des laboratoires du CNRS (le LAAS pour son expertise robotique et le CerCo pour l’IA inspirée des neuro-sciences), également impliqués dans la chaire synergie C3PO du cluster IA toulousain ANITI. Le travail de recherche sera réalisé à Toulouse : il est prévu à 40% dans les locaux d’Airbus et à 60% dans les locaux académiques (CNRS/ANITI). Le début de la thèse est envisagé en Octobre 2026.

Etes-vous prêt à faire progresser l'intelligence des robots pour qu'ils s'adaptent dynamiquement aux instructions humaines dans un environnement industriel aéronautique ?


Votre environnement de travail :

Capitale mondiale de l'aéronautique et capitale européenne de la recherche dans le spatial, Toulouse est une ville dynamique du sud-ouest de la France desservie par un aéroport international. Idéalement située entre la mer Méditerranée et l'océan Atlantique et à proximité des Pyrénées, elle offre de nombreuses possibilités d'activités de plein air !


Parce que nous prenons soin de vous :

* Avantages financiers: Salaire attractif, accords d’intéressement et de participation, plan d'épargne salariale abondé par Airbus, plan d’actionnariat salarié sur la base du volontariat, avec attribution d'actions gratuites en fonction du nombre d’actions souscrites.

* Équilibre vie privée / professionnelle: Des jours de congés supplémentaires pour occasions spéciales et des options de transfert de congés, un comité d'entreprise proposant de nombreuses activités socio-culturelles et d’autres services.

* Bien-être / santé: couverture complémentaire des frais de santé et de prévoyance (incapacité, invalidité, décès). Selon le site : centre de services de santé, services de conciergerie, salle de sport, application de covoiturage.

* Développement individuel: des opportunités d’évolution et des possibilités de formations nombreuses (catalogue de plus de 10.000 e-formations disponibles en libre accès pour développer votre employabilité, certifications, programmes de développement accéléré, parcours expert, mobilité nationale et internationale).

Chez Airbus, nous vous aidons à travailler, à vous connecter et à collaborer plus facilement et de manière plus flexible. Partout où cela est possible, nous favorisons la flexibilité dans nos modes de travail afin de stimuler l'esprit d'innovation.


Vos challenges :

Contexte de la thèse :


L'apprentissage par renforcement (“Reinforcement Learning” ou RL) est devenu un acteur majeur dans la prise de décision séquentielle en robotique, notamment pour gérer des entrées multimodales complexes (informations vectorielles, perception visuelle, instructions en langage naturel…). Dans le secteur aérospatial, le RL multimodal ouvre des perspectives de développement de robots plus adaptatifs, capables d'opérer dans des environnements industriels pour des tâches variées : inspection, manipulation, navigation, etc.

La robotique est un champ de recherche actuellement très actif, avec deux impulsions récentes qui révolutionnent le domaine. La première vient du RL qui, depuis l’avènement de simulateurs massivement parallèles, permet par exemple de générer des politiques de marche en quelques minutes/heures. La seconde est l’utilisation de modèles de fondation robotique pré-entrainés type VLA (Vision-Language-Action), une extension naturelle des LLM (Large Language Models) & VLM (Vision-Language Models) à la robotique, permettant de capitaliser sur des connaissances acquises pour ne pas apprendre de zéro.

L'objectif de cette thèse est d’utiliser le RL multimodal pour apprendre aux robots à adapter dynamiquement leur comportement à partir d’instructions de haut niveau fournies par des humains, en évitant de passer par l’ingénierie de fonction de récompense complexe. Ceci sera abordé en s’appuyant sur des modèles VLA pré-entrainés ainsi que sur la théorie du Global Workspace pour une fusion efficace des différentes modalités (proprioception, vision, instructions en langage naturel).

Il est à noter qu’il existe plusieurs types de robots (bras robotiques, quadrupèdes…) qui peuvent jouer un rôle dans les opérations visées. Ainsi, des algorithmes généralistes applicables à différentes morphologies seront à privilégier dans ce contexte.


Le travail de thèse consistera donc à :

* Réaliser un état de l'art sur le RL multimodal, les modèles Vision-Language-Action (VLA) et les mécanismes de fusion multimodale (Global Workspace Theory)

* Concevoir un cadre de RL multimodal basé sur des modèles de fondation robotique

* Proposer des méthodes pour simplifier/automatiser l’ingénierie de la fonction de récompense

* Développer des techniques de transfert robuste et valider les politiques apprises sur des plateformes robotiques physiques


Votre carte d’embarquement :

* Master (de Recherche idéalement) en Intelligence Artificielle, Robotique ou Apprentissage par Renforcement

* Aisance en programmation Python & librairies de deep learning (PyTorch, Jax…)

* Compétence en apprentissage par renforcement (RL) et idéalement en simulation robotique

* Connaissances en IA pour la vision, le traitement du langage naturel et la fusion multimodale

* Intérêt pour la recherche scientifique et les applications industrielles, autonomie

Vous ne matchez pas à 100% ? Pas d'inquiétude ! Airbus vous accompagnera dans votre plan de développement.


Donnez une nouvelle dimension à votre carrière en candidatant en ligne maintenant !

ENGLISH VERSION


Airbus Commercial Aircraft is looking for a PhD student on the subject : “Multimodal Reinforcement Learning for Robotics (M/F)” to join our Central Research & Technology department based in Toulouse, France.

The department works in collaboration with CNRS laboratories (LAAS for its robotics expertise and CerCo for neuroscience-inspired AI), also involved in the C3PO synergy chair of the Toulouse AI cluster ANITI. The research work will be carried out in Toulouse: 40% is planned in Airbus premises and 60% in academic premises (CNRS/ANITI). The start of the thesis is planned for October 2026.

Are you ready to advance robot intelligence so they can dynamically adapt to human instructions in an aeronautical industrial environment ?


Your working environment :

Global capital of aeronautics and European capital for space research, Toulouse is a dynamic city in the southwest of France served by an international airport. Ideally located between the Mediterranean sea and the Atlantic ocean and close to the Pyrenees mountains, it offers plenty of options for outdoor activities!


How we care for you :

* Financial rewards: Attractive salary, agreements on success and profit sharing schemes, employee savings plan abounded by Airbus and employee stock purchase plan on a voluntary basis.

* Work / Life Balance: Extra days-off for special occasions, holiday transfer option, a Staff council offering many social, cultural and sport activities and other services.

* Wellbeing / Health: Complementary health insurance coverage (disability, invalidity, death). Depending on the site: health services center, concierge services, gym, carpooling application.

* Individual development: Great upskilling opportunities and development prospects with unlimited access to +10.000 e-learning courses to develop your employability, certifications, expert career path, accelerated development programmes, national and international mobility.

At Airbus, we support you to work, connect and collaborate more easily and flexibly.Wherever possible, we foster flexible working arrangements to stimulate innovative thinking.


Your challenges :


PhD thesis scope:


Reinforcement Learning (RL) has become a major player in sequential decision-making in robotics, particularly for managing complex multimodal inputs (vector information, visual perception, natural language instructions, etc.). In the aerospace sector, multimodal RL opens up perspectives for developing more adaptive robots, capable of operating in industrial environments for varied tasks: inspection, manipulation, navigation, etc.

Robotics is currently a very active field of research, with two recent impulses that are revolutionizing the domain. The first comes from RL which, since the advent of massively parallel simulators, enables for instance walking policies to be generated in a few minutes/hours. The second is the use of pre-trained robotic foundation models such as VLAs (Vision-Language-Action models), a natural extension of LLMs (Large Language Models) & VLMs (Vision-Language Models) to robotics, making it possible to capitalize on acquired knowledge and avoid learning from scratch.

The objective of this thesis is to use multimodal RL to teach robots to dynamically adapt their behavior based on high-level instructions provided by humans, while avoiding the need for complex reward function engineering. This will be addressed by relying on pre-trained VLA models as well as the Global Workspace theory for efficient fusion of different modalities (proprioception, vision, natural language instructions).

It should be noted that there are several types of robots (robotic arms, quadrupeds…) that can play a role in the target operations. Thus, generalized algorithms applicable to different morphologies will be favored in this context.


The thesis work will therefore consist of:

* Conducting a state of the art on multimodal RL, Vision-Language-Action (VLA) models and multimodal fusion mechanisms (Global Workspace Theory)

* Designing a multimodal RL framework based on robotic foundation models

* Proposing methods to simplify/automate reward function engineering

* Developing robust transfer techniques and validating learned policies on physical robotic platforms


Your boarding pass :

* Master (of Research ideally) in Artificial Intelligence, Robotics or Reinforcement Learning

* Comfortable in Python programming & deep learning libraries (PyTorch, Jax…)

* Competence in Reinforcement Learning (RL) and ideally in robotic simulation

* Knowledge of AI for vision, natural language processing and multimodal fusion

* Interest in scientific research and industrial applications, autonomy

Not a 100% match? No worries! Airbus supports your personal growth with customized development solutions.

Take your career to a new level and apply online now!

Cet emploi exige une connaissance des risques de conformité potentiels et un engagement à agir avec intégrité, comme base de la réussite, de la réputation et de la croissance durable de la société.

Unité légale:

AIRBUS SAS

Type de contrat:

Doctorat, Contrat CIFRE

-------

Classe Emploi (France): Classe F11

Niveau d'expérience:

Etudiant

Famille d'emplois:

Digital

En soumettant votre CV ou votre candidature, vous autorisez Airbus à utiliser et stocker des informations vous concernant à des fins de suivi de votre candidature ou de futurs emplois. Ces informations ne seront utilisées que par Airbus.
Airbus s'engage à assurer la diversité de sa main-d'œuvre et à créer un environnement de travail inclusif. Nous accueillons toutes les candidatures, quels que soient le milieu social et culturel, l'âge, le genre, l'invalidité, l'orientation sexuelle ou les croyances religieuses des postulants.

Airbus est depuis toujours attaché à l'égalité des chances pour tous. En tant que tel, nous ne demanderons jamais aucun type d’avance de frais dans le cadre d'un processus de recrutement. Toute usurpation d'identité d'Airbus à cette fin doit être signalée àemsom@airbus.com .

Chez Airbus, nous vous aidons à travailler, à vous connecter et à collaborer plus facilement et de manière plus flexible. Dans la mesure du possible, nous favorisons les modalités de travail flexibles pour stimuler la pensée innovante.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder
Voir plus d'offres d'emploi
Estimer mon salaire
JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.

Offres similaires
Emploi Toulouse
Emploi Haute-Garonne
Emploi Midi-Pyrénées
Intérim Toulouse
Intérim Haute-Garonne
Intérim Midi-Pyrénées
Accueil > Emploi > Thèse CIFRE /PhD - Apprentissage par renforcement multimodal pour la robotique (M/F)

Jobijoba

  • Conseils emploi
  • Avis Entreprise

Trouvez des offres

  • Emplois par métier
  • Emplois par secteur
  • Emplois par société
  • Emplois par localité
  • Emplois par mots clés
  • Missions Intérim
  • Emploi Alternance

Contact / Partenariats

  • Contactez-nous
  • Publiez vos offres sur Jobijoba
  • Programme d'affiliation

Suivez Jobijoba sur  Linkedin

Mentions légales - Conditions générales d'utilisation - Politique de confidentialité - Gérer mes cookies - Accessibilité : Non conforme

© 2026 Jobijoba - Tous Droits Réservés

Les informations recueillies dans ce formulaire font l’objet d’un traitement informatique destiné à Jobijoba SA. Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous disposez d’un droit d’accès et de rectification aux informations qui vous concernent. Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant. Pour en savoir plus, consultez vos droits sur le site de la CNIL.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder