Contexte et atouts du poste
L’ objectif est de
contribuer au développement (théorique et/ou pratique) algorithmique d'une méthode de résolution approchée des jeux bayésiens.
Mission confiée
Missions :
Etant donné un jeux Bayésien, la recherche d'information publique peut être réduite à un parcours en profondeur dans graphe dérivé du jeu Bayésien. Nous cherchons à étendre cette méthode pour approximer le jeu Bayésien par un autre jeu, le plus proche possible, contenant de l'information publique. Ce faisant, le temps de calcul pour la recherche d'équilibres de Nash devrait être significativement réduit.Les bases théoriques et une implémentation en C++ de cette décomposition existent déjà.
Les objectifs du stage sont ouverts, mais le stagiaire pourrait de préférence travailler sur un ou plusieurs des aspects suivants :
• mener une validation expérimentale de l'approche de décomposition approchée;
• proposer, mettre en œuvre et évaluer des variantes du programme linéaire permettant la décomposition;
• prouver que le problème de décomposition approchée appartient à la classe de complexité NP.
Pour une meilleure connaissance du sujet de recherche proposé :-
- John F Nash Jr. Equilibrium points in n-person games. Proceedings of the national academy of sciences, 36:48–49,
1950.
- Frans A Oliehoek, Shimon Whiteson, and Matthijs TJ Spaan. Exploiting structure in cooperative bayesian games. In
Proceedings of the Twenty-Eighth Conference on Uncertainty in Artificial Intelligence, pages 654–663, 2012.
- Noam Brown, Anton Bakhtin, Adam Lerer, and Qucheng Gong. Combining deep reinforcement learning and search
for imperfect-information games. Advances in neural information processing systems, 33:17057–17069, 2020.
Collaboration :
Christine Solnon (INSA Lyon)
Principales activités
Principales activés (5 maximum) :
1. revue de la littérature
2. développement C++
3. développement théoriques
4. rédaction des résultats obtenu
Compétences
Les compétences recherchées sont les suivantes: (en gras celles nécessaires)
• connaissances basiques en C++;
• théorie des graphes;
• classes de complexité et réductions.
Langues : Français/Anglais
Avantages
5. Restauration subventionnée
6. Transports publics remboursés partiellement
7. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
Rémunération
Gratification
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.