Emploi
J'estime mon salaire
Mon CV
Mes offres
Mes alertes
Se connecter
Trouver un emploi
TYPE DE CONTRAT
Emploi CDI/CDD
Missions d'intérim Offres d'alternance
Astuces emploi Fiches entreprises Fiches métiers
Rechercher

Etude de représentation de données"interval valued data" pour classifieurs à données ponctuelles f/h

Lannion
Orange Business Services
Publiée le 17 octobre
Description de l'offre

About the role

Contexte: Dans de nombreuses situations réelles, l'imprécision, l'incertitude ou la variabilité peuvent être présentes dans certaines données collectées. Dans ce cas les données utilisées ne sont pas des valeurs précises, ponctuelles (la température est de 10.23 degrés) mais des données à valeur d'intervalle (la température est entre 10 et 12 degrés). On parle de « Interval-Valued Data » (IVD). Par rapport aux données « ponctuelles », l’IVD peut exprimer l'incertitude et la variabilité des données. Apprendre un modèle de machine learning (on se limitera dans cette étude à la classification supervisée) qui se base sur ce type de données requiert parfois de transformer la valeur « intervalle » en une autre représentation [1].

Mission : Après l’étude menée dans [1], on cherchera à étendre ces travaux en (re)réalisant leur étude mais aussi en testant d’autres formes de représentation (tel que par exemple un simple « one hot encoding » [2] des intervalles de valeurs). Pour ce faire :

(i) un travail raisonnable de bibliographie sera à réaliser puis

(ii) un benchmark sera à réaliser versus (le travail de biblio définira les éléments de la liste ci-dessous)

(a) plusieurs classifieurs (dédiés aux données ponctuelles 1)

(b) plusieurs représentations

(c) potentiellement à plusieurs types d’IVD (à recouvrement ou sans recouvrement)

(d) et enfin sur plusieurs jeux de données, soit des jeux de données de la littérature de l’IVD, soit des jeux de données classiques sur lesquels on aurait calculé des intervalles de valeurs (ou de groupes de modalités) de manière supervisée au préalable (via un arbre, via Khiops, etc…).

Références bibliographiques :

[1] “An Interval-Valued Data Classification Method Based on the Unified Representation Frame”, 2020, IEEE Open Access, Xiaobo Qi, Husheng Guo, Zadorozhnyi Artem and Wenjian Wang

[2] “A benchmark of categorical encoders for binary classification”, 2023, NeurIPS Datasets and Benchmarks Track, Federico Matteucci, Vadim Arzamasov and Klemens Böhm

[3] “Multiclass Classification With Fuzzy-Feature Observations: Theory and Algorithms” in IEEE Transactions on Cybernetics Guangzhi Ma, Jie Lu, Feng Liu; Zhen Fang and Guangquan Zhang

(1) A priori l’étude ne s’intéressera pas aux modèles dédiés aux données IVD tel que : « Binary classification SVM-based algorithms with interval-valued training data using triangular and Epanechnikov kernels”, « Lev V. Utkin et al, Neural Networks, 2016.; ou encore “A pattern classifier for interval-valued data based on multinomial logistic regression model," 2012 IEEE International Conference on Systems, Man, and Cybernetics (SMC), A. P. de Barros, et al.

about you

Le profil souhaité est BAC + 5, Master Industriel (ou recherche) informatique et/ou statistiques ou école d'ingénieur.

Data scientist avec goût pour l’informatique et les mathématiques appliquées ; si possible ayant suivi des cours, TP, stage sur les séries temporelles

Les connaissances en Python, Scikit-learn … sont indispensables.

additional information

Proche de la mer vous serez au sein d’une équipe composée de chercheurs en Machine Learning, de Data Scientists et d’experts en machine learning dans une direction d’innovation.

department

Basée à Lannion (22), l'équipe PROF déploie son activité dans le domaine des statistiques, machine learning et intelligence artificielle, depuis des travaux fondamentaux jusqu'à l'accompagnement des unités opérationnelles d'Orange sur des cas d'usage précis.

L'équipe se compose d'une vingtaine de permanents et accueille actuellement quatre doctorants.

contract

Internship

Start date : 01 Apr 2025

Niveau d’études préparé pendant le stage Indemnité brute selon école Bac+5 de 1572 € à 2096 € / mois

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder
Offre similaire
Stage de recherche - classification de données temporelles multi-table avec concept-drift f/h
Lannion
Stage
Orange Business Services
Offre similaire
Stage - développement full-stack d'un démonstrateur pour l'anonymisation de contenus audio f/h
Lannion
Stage
Orange Business Services
Offre similaire
Stage masquage de l'attention pour le traitement des variables manquantes sur les données tabulaires f/h
Lannion
Stage
Orange Business Services
Voir plus d'offres d'emploi
Estimer mon salaire
JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.

Offres similaires
Recrutement Orange Business Services
Emploi Orange Business Services à Lannion
Emploi Lannion
Emploi Côtes-d'Armor
Emploi Bretagne
Intérim Lannion
Intérim Côtes-d'Armor
Intérim Bretagne
Accueil > Emploi > Etude de représentation de données"Interval Valued Data" pour classifieurs à données ponctuelles F/H

Jobijoba

  • Conseils emploi
  • Avis Entreprise

Trouvez des offres

  • Emplois par métier
  • Emplois par secteur
  • Emplois par société
  • Emplois par localité
  • Emplois par mots clés
  • Missions Intérim
  • Emploi Alternance

Contact / Partenariats

  • Contactez-nous
  • Publiez vos offres sur Jobijoba
  • Programme d'affiliation

Suivez Jobijoba sur  Linkedin

Mentions légales - Conditions générales d'utilisation - Politique de confidentialité - Gérer mes cookies

© 2025 Jobijoba - Tous Droits Réservés

Les informations recueillies dans ce formulaire font l’objet d’un traitement informatique destiné à Jobijoba SA. Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous disposez d’un droit d’accès et de rectification aux informations qui vous concernent. Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant. Pour en savoir plus, consultez vos droits sur le site de la CNIL.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder