# Stage IA/Data science* Paris* Stage* Développer et optimiser des pipelines de **collecte et traitement d’URLs** pour analyser des sites web de manière précise.* Identifier et classifier les **URLs dupliquées, pertinentes ou peu utiles**, y compris dans des applications web modernes (SPA).* Contribuer à des analyses statistiques pour comprendre quelles **pages sont réellement visitées** et comment améliorer notre mapping des sites web.* Participer à l’amélioration de notre stack IA existante : **RAG Chatbot**, **Graph RAG**, et modules de **détection de similarité multilingue**.* Travailler sur le **maintien et le développement** de notre infrastructure Python pour assurer performance et scalabilité.* Exploiter et manipuler des **graphes de données** pour modéliser les relations entre pages, URLs et sites web.* Apporter ton support sur des projets opérationnels et des demandes clients, en mettant à profit tes compétences en data, IA et infrastructure.## Profil recherché* Étudiant(e) en dernière année d’école d’ingénieur ou master en **data science, data engineering, informatique ou NLP**.* Très bonne maîtrise de **Python** et des bibliothèques data (pandas, numpy, scikit-learn…).* Connaissance ou intérêt pour le **scraping web**, le traitement de texte et l’analyse de données complexes.* Compétences en **NLP** : analyse de texte, embeddings, détection de similarité multilingue.* Expérience ou intérêt pour les **graphes de données** et les modèles relationnels (Graph RAG, knowledge graph, network analysis…).* **Bases en CI/CD et gestion de stack technique** : compréhension des workflows de déploiement, tests automatisés et intégration continue.* Connaissances générales du **web et de son fonctionnement** : HTTP, SPA, URL structures, crawling.* Curiosité, autonomie et capacité à proposer des solutions **innovantes et concrètes**.* Goût pour les environnements **dynamiques et tech-driven**, où chaque contribution a un impact direct.**Entretien technique** avec un membre de l’équipe, incluant un petit **test technique** pour évaluer tes compétences pratiques en Python, data et NLP.* Type de contrat :
**Stage**
(3 à 6 mois)* Lieu :
**Paris*** Niveau d'études :
**Bac +5 / Master*** Expérience :
**<
6 mois*** **Télétravailponctuel autorisé**#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.