Contexte et atouts du poste
Les microphones sont aujourd’hui omniprésents dans notre environnement : aides auditives, enceintes connectées, smartphones, casques de réalité augmentée, systèmes de visio-conférence, … L’utilisation confortable de ces dispositifs nécessite l’emploi d’algorithmes permettant de réhausser les signaux de paroles d’intérêt, même en présence de sources de bruit et de réverbération. Cette tâche est rendue d’autant plus difficile en conditions dynamiques, dans lesquels sources et microphones peuvent se déplacer. Cette thèse s’inscrit dans un projet de recherche Franco-Allemand (ANR-DFG AWESOME 2026-2029) visant à exploiter l’ensemble des microphones disponibles dans une salle, formant ainsi un réseau dit distribué ou ad-hoc, pour améliorer grandement la qualité des signaux de paroles captés.
Mission confiée
La difficulté principale pour atteindre les objectifs du projet est que les positions relatives et absolues des microphones dans la pièce ainsi que leurs caractéristiques acoustiques et celles de la salle ne sont généralement que partiellement connues, ce qui empêche l’exploitation du réseau complet à son plein potentiel. Pour débloquer ce verrou, cette thèse explorera des approches combinant méthodes acoustiques inverses et apprentissage automatique, et en particulier les récents modèles génératifs basés sur la diffusion. Les pistes suivantes seront explorées :
1. Calibration par clappements de mains. Un modèle de diffusion de type Shrödinger Bridge [4] sera utilisé pour transformer des enregistrements de clappements de main en réponses impulsionnelles de salle, dont les parties précoces seront exploitée par la méthode inverse [5] pour localiser les réflecteurs.
2. Auto-localisation d'antennes de microphones. Des méthodes basées sur le transport optimal seront étudiées pour obtenir la position et orientation relatives de deux antennes de microphones en s'aidant des réflexions acoustiques précoces et de la méthode du point précédent.
3. Interpolation de champs sonore. Des méthodes interpolant le champs sonores entre deux points de mesure pour aborder des scénarios dynamiques seront étudiées, en s'appuyant sur le point précédent.
4. Déréverbération et débruitage multicanale préservant les réflexions précoces. Une approche de déréverbération telle que [1] ou [2] sera étendue au scénario considéré, puis combinée avec une méthode acoustique inverse telle que [3] pour localiser les dispositifs par rapports aux réflecteurs les plus proches.
Principales activités
5. Recherches et lectures bibliographiques
6. Développement de code Python / PyTorch
7. Production d'expériences numériques et analyses des résultats
8. Collecte de données acoustiques
9. Rédactions d'articles scientifiques
10. Participation à des conférences internationales
Compétences
11. Excellent niveau en programmation Python. PyTorch est un plus
12. Formation en deep learning, et traitement du signal. Des connaissances ou un intérêt pour l’audio, l’acoustique, les méthodes numériques ou l’optimisation sont un plus.
13. Niveau master 2 (en informatique, traitement du signal, machine learning, acoustique ou mathématiques appliquées) et un fort intérêt pour la recherche académique.
Avantages
14. Restauration subventionnée
15. Transports publics remboursés partiellement
16. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
17. Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
18. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
19. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
20. Accès à la formation professionnelle
21. Sécurité sociale
Rémunération
2300 € brut/mois
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.