Votre rôle
Les algorithmes de détection d’anomalies sont une brique essentielle pour la supervision des services internes comme externes chez Orange. Ils permettent d’identifier rapidement tout comportement inhabituel susceptible d’indiquer un incident ou une défaillance, contribuant ainsi à l'excellence de notre qualité de service.
Ce stage consiste en explorer une nouvelle méthodologie pour la détection d'anomalies. Elle repose sur la combinaison de deux familles de modèles fournis par la librairie d'AutoML Khiops
(https://www.khiops.org) :
- les histogrammes régularisés non-supervisés
- les modèles predictifs : classifieurs et regresseurs
L'idée est d'exploiter le modèle génératif associé à un prédicteur et le combiner avec les histogrammes de chaque marginal pour obtenir une estimation de la densité jointe des données. Les anomalies seront définies alors par seuillage sur la densité estimée.
Un point additionnel de cette méthodologie est qui permettrait de chercher des anomalies sur des données multi-table (relationnelles).
Vos tâches seront les suivantes :
- Comprendre la théorie des modèles de Khiops
- Assimiler la théorie de la nouvelle méthodologie
- Prendre en main la librairie Python de Khiops
- Implémenter une preuve de concept (PoC) de la nouvelle méthodologie
- Mener des expériences comparatives aux méthodes de l'état de l'art (Isolation Forest, One-Class
SVM, etc)
- Étendre la méthodologie sur des données multi-table
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.