Le challenge 🚀
Notre catalogue de prestations s’appuie sur des données provenant de multiples partenaires et sources. Avec la croissance de notre offre, un enjeu majeur émerge : garantir la cohérence, la complétude et la fiabilité de nos données résidences et logements. Descriptions, catégories, équipements, capacités… ces informations doivent être irréprochables pour alimenter notre site, nos algorithmes de recommandation et nos outils internes.
C’est là que vous intervenez.
⛷Voici ce que seront vos missions et challenges :
Amélioration de la qualité des données hébergements
* Auditer et nettoyer les données existantes sur nos résidences et logements (identification des incohérences, doublons, données manquantes).
* Labelliser et catégoriser manuellement des hébergements pour constituer des jeux de données de référence fiables.
* Définir et documenter des règles de qualité applicables à l’ensemble du catalogue.
Développement d’outils d’automatisation (Python)
* Concevoir et développer des scripts de matching automatique entre nos données internes et celles de nos partenaires (rapprochement de résidences, détection de doublons inter-sources).
* Explorer et mettre en œuvre des approches de catégorisation automatique (règles métier, NLP, modèles de classification) pour réduire le besoin de labellisation manuelle.
* Mesurer la performance de ces outils et itérer pour améliorer leur précision.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.