Informations générales Organisme de rattachement CNRS Référence UMR5505-CHLBOU-106 Date de début de diffusion 08/05/2026 Date de parution 26/05/2026 Date de fin de diffusion 29/05/2026 Intitulé long de l'offre Doctorant (H/F) - Politique optimale comme problème de classification Date limite de candidature 29/05/2026 Nature du contrat CDD de 3 ans Versant Fonction Publique de l'Etat Catégorie Catégorie A (cadre) Nature de l'emploi Emploi ouvert uniquement aux contractuels Domaine / Métier Recherche - Chercheuse / Chercheur Statut du poste Vacant Intitulé du poste Doctorant (H/F) - Politique optimale comme problème de classification Descriptif de l'employeur Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique. Description du poste Sujet de thèse : Ce projet de doctorat propose de considérer la recherche d’une politique optimale en apprentissage par renforcement comme un problème de classification, en exploitant la structure géométrique selon laquelle les actions optimales partitionnent l’espace des états. Plutôt que d’apprendre des fonctions de valeur complètes, l’idée est d’apprendre directement les frontières où deux actions deviennent équivalentes, lesquelles définissent les régions dans lesquelles chaque action est optimale. Le projet débute par un cadre simple à deux dimensions et deux actions afin d’étudier comment ces frontières de décision peuvent être apprises efficacement, d’abord via des mises à jour basées sur des seuils, puis à l’aide de fonctions de frontière paramétrées. Il généralise ensuite cette approche à des espaces d’états et d’actions de dimension plus élevée en utilisant des méthodes basées sur le gradient et des approximateurs de fonctions tels que des modèles linéaires ou des réseaux de neurones. En se concentrant sur l’apprentissage de ces frontières plutôt que sur celui des fonctions de valeur complètes, le projet vise à développer des algorithmes d’apprentissage par renforcement nécessitant moins de données et convergeant plus rapidement. Contexte : Le poste est basé à l’IRIT (Institut de Recherche en Informatique de Toulouse), un laboratoire majeur en informatique regroupant plusieurs centaines de chercheurs et doctorants. Le doctorant sera accueilli au sein du département ASR (Architecture, Systèmes et Réseaux), dont les thématiques couvrent notamment les réseaux, les systèmes distribués et l’apprentissage automatique appliqué aux systèmes. Le projet s’inscrit dans un environnement scientifique dynamique, avec des collaborations possibles avec plusieurs chercheurs du laboratoire travaillant sur l’apprentissage par renforcement et les systèmes en réseau, ainsi qu’avec l’écosystème toulousain de recherche en intelligence artificielle, notamment dans le cadre de la chaire ANITI dédiée à l’apprentissage par renforcement. Conditions particulières d'exercice Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche. Descriptif du profil recherché Contraintes et risques : Temps plein Oui Rémunération contractuels (en € brut/an) La rémunération est d'un minimum de 2300,00 € mensuel Localisation du poste Europe, France, Occitanie, Haute Garonne (31) Géolocalisation du poste TOULOUSE Lieu d'affectation (sans géolocalisation) 31071 TOULOUSE (France) Critères candidat Niveau d'études / Diplôme Niveau 8 Doctorat/diplômes équivalents Spécialisation Formations générales Langues Français (Seuil)
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.