Stage recherche - Classification précoce de séries temporelles F/H, Châtillon
"Vous vous rêvez bâtisseur, construisez un nouvel algorithme de ML pour analyser les séries temporelles" et rejoignez-nous !, Bruno, manager
Dans ce stage, nous nous intéressons à la classification précoce de séries temporelles, où des séries sont observées au fur et à mesure, avec pour objectif de déclencher des prédictions de classe avant que les séries ne soient complètes. La collecte d'informations supplémentaires peut améliorer la précision, mais attendre peut poser des problèmes (pannes, sécurité, etc.). Il faut donc optimiser le compromis entre la qualité des prédictions et leur précocité, en utilisant une matrice de coût de mauvaise classification et un coût d’attente.
Orange a réalisé une étude comparative des principales approches [1], et une librairie Python open source [2]. Ce stage vise à développer de nouveaux algorithmes en raffinant deux approches performantes :
1. CALIMERA [3] : une approche non-myope qui estime l’espérance de coût pour les futurs instants et déclenche la prédiction lorsque cette espérance est minimale. Inspirée de [4], elle utilise un modèle de régression pour choisir le moment de déclenchement. Nous tenterons d’améliorer cette approche en modifiant le problème de régression et en raffinant le calcul de l’espérance.
2. STOPPING RULE [5] : une fonction de déclenchement définie a priori, combinant la probabilité de la classe la plus probable, l’écart entre les deux classes principales, et la proportion de la série observée. Nous chercherons à l’améliorer en intégrant le coût de mauvaise classification et le coût d’attente.
Une publication scientifique pourra être envisagée si les résultats sont probants.
"Rejoignez une équipe passionnée, solidaire et dynamique, basée sur un campus à l'américaine avec des installations de pointe", Bruno, manager
Profil souhaité :
* BAC + 5, Master en informatique, statistiques ou école d'ingénieur
* Intérêt pour la recherche, les aspects appliqués et théoriques
Compétences :
* Connaissances en Python et Scikit-learn indispensables
* Connaissances en statistiques, mathématiques ou apprentissage statistique souhaitables
[2] Renault, Aurélien, et al. "ml_edm package: a Python toolkit for Machine Learning based Early Decision Making.", 2024
Vous intégrerez une équipe de chercheurs en Machine Learning et Data Scientists, dans une démarche d’innovation.
L’analyse de données et l’intelligence artificielle sont des leviers clés pour Orange, permettant de réinventer la relation client, d’optimiser la gestion des réseaux, d’améliorer l’expérience client et de se différencier.
L’ambition de la Division Innovation est de renforcer le leadership technologique d’Orange, en mobilisant la recherche pour une innovation responsable, au service de l’humain, en éclairant les choix stratégiques et en influençant l’écosystème digital mondial.
Le domaine Digital Cloud Services propose des fondamentaux techniques sécurisés et automatisés, utilisables par tous, pour soutenir la production digitale tout au long du cycle de vie : conception, développement, test, déploiement, supervision, et intégration de l’IA.
Vous rejoindrez l’équipe Automated Data Intelligence at Scale, regroupant chercheurs, data scientists opérationnels et architectes logiciels, couvrant la recherche académique jusqu’à l’industrialisation de solutions opérationnelles.
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.