Votre rôle
Vous travaillerez à conduire les premières expériences relatives à l’analyse translingue de langues africaines, à des fins de développement de technologies d’interaction vocale.
En Afrique, le multilinguisme concerne la majorité des pays et les locuteurs sont généralement plurilingues : ils s’expriment couramment dans plusieurs langues, très généralement à l’oral. Pourtant, les produits et services proposés par Orange (comme par quasiment tous les équipementiers et opérateurs de services) ne sont aujourd’hui pas adaptés aux populations africaines : alors que les clients ne s’expriment très majoritairement qu’à l’oral, ces services ne sont utilisables qu’à l’écrit et ne permettent d’interagir que dans une seule langue, souvent mal maîtrisée par une bonne partie des populations. Ce contexte crée un climat d’insécurité linguistique et de clivage face aux nouvelles technologies.
Désormais, les enjeux sont de réduire la fracture numérique et de créer des produits et services utilisables par tous. Orange se donne aujourd’hui pour vocation de dialoguer naturellement avec ses clients en créant des services d’interaction de type « bot », adaptés à chacun. En contexte subsaharien, l’illettrisme invalide l’usage de l’écrit et impose l’usage de la parole : il s’agit donc de construire des solutions d’interaction par la parole, localisées dans les langues en usage dans les régions de déploiement.
Le premier composant nécessaire au développement des systèmes interactionnels est le système de reconnaissance automatique de la parole (ASR). Les dernières architectures à base de Transformers ont permis de progresser sur la reconnaissance automatique des langues africaines. Néanmoins, les modèles actuellement disponibles en ligne sont bien loin de fournir les performances atteintes par les grands modèles de l’anglais ou du français. La qualité des transcriptions produites par la machine est de ce fait fortement impactée, ce qui entraîne un manque de fiabilité envers les corpus massifs qui pourraient être créés. Aussi, bien que prometteuses, ces architectures sont difficiles à mettre en œuvre pour les langues africaines car elles sont extrêmement gourmandes en données et en capacité de calcul. Or, la disponibilité de données locales et pertinentes pour les tâches que l’on veut résoudre est limitée, tout comme les infrastructures nécessaires à l’apprentissage et à l’inférence.
Il s’agira alors de trouver une solution efficiente, grâce à la mutualisation des données vocales en langues africaines dont dispose Orange, afin de construire un système intermédiaire multilingue qui sera optimisé pour être utilisé en entrée de ses systèmes monolingues.
Références :
1. Word Embeddings for Speech Recognition, https://static.googleusercontent.com/media/research.google.com/fr//pubs/archive/42543.pdf
2. Visualizing Data using t-SNE, https://www.jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.