Votre rôle
Vos missions quotidiennes :
* Vous menez une revue de littérature ciblée et formalisez des hypothèses de recherche sur les facteurs de latence en streaming selon les langues, accents et conditions audio
* Vous concevez un protocole expérimental rigoureux pour mesurer la latence (token emission delay, latence E2E, RTF), avec critères d’inclusion, variables de contrôle et tests statistiques
* Vous mettez en place et optimisez des pipelines d’inférence streaming en Python/PyTorch, en instrumentant précisément les métriques et en assurant la reproductibilité (scripts, seeds, versions)
* Vous comparez plusieurs architectures ASR (end-to-end, transducteurs, attention-based…) et analysez les compromis qualité/latence par langue et configuration d’inférence, avec ablations contrôlées
* Vous réalisez une analyse d’erreurs multilingue (WER/CER par catégories, effets accents/bruit/parole rapide), et investiguez les goulots d’étranglement (chunking, VAD, décodage)
* Vous documentez vos travaux (journal d’expériences, figures, tableaux, protocole) et préparez des supports en vue d’une diffusion scientifique (rapport, présentation, éventuelle soumission).
Vos missions ponctuelles et/ou exemples de projets :
* Vous réalisez un état de l’art sur l’ASR en streaming et les techniques de réduction/mesure de latence, en synthétisant les approches et leurs limites
* Vous implémentez un module plug-and-play de mesure fine de la latence et de la qualité, accompagné d’un package de reproductibilité (scripts, configs, README)
* Vous étudiez l’impact des stratégies de détection de voix (VAD) sur la latence bout-en-bout et recommandez des réglages selon les cas d’usage, étayés par des tests statistiques
* Vous formalisez un guide de bonnes pratiques “latence vs qualité” par langue, avec recommandations d’inférence (chunking, caching, quantization), profils matériels (CPU/GPU) et check-list de validation.
Les compétences que vous aurez l’opportunité de développer grâce à ce stage:
* Vous consoliderez votre compréhension des systèmes ASR en contexte streaming et votre maîtrise de la méthodologie expérimentale (définition d’hypothèses, protocoles, ablations, tests statistiques)
* Vous gagnerez en aisance sur la mesure et l’analyse de la latence multilingue, le benchmarking de modèles et l’analyse d’erreurs
* Vous renforcerez vos pratiques de recherche reproductible (gestion d’expériences, paquets de réplication, documentation) ainsi que vos capacités de synthèse et de rédaction scientifique.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.