Votre rôle au sein de l’équipe
Sous la supervision du Data Architect, le/la stagiaire participera aux missions suivantes :
1. Explorer l’IA pour interagir avec les données (Mission principale)
• Tester Databricks Genie et Copilot pour poser des questions en langage naturel et obtenir des insights.
• Comparer les performances et la pertinence des réponses obtenues par l’IA par rapport aux méthodes classiques (SQL, BI).
• Contribuer à l’évaluation de ces outils et proposer des retours d’expérience à l’équipe.
2. Participer à la migration vers Unity Catalog
• Aider à la structuration et à l’enrichissement des métadonnées dans Unity Catalog.
• Accompagner l’équipe dans la mise en place des bonnes pratiques pour organiser et sécuriser les données.
3. Améliorer la qualité des données
• Mettre en place des règles simples et automatisées pour assurer la fiabilité des informations.
• Tester l’utilisation de modèles IA pour identifier et corriger les anomalies dans les données.
• Contribuer à la documentation des bonnes pratiques en Data Quality.
4. Optimiser les coûts de l’infrastructure Data
• Travailler avec le Tech Lead et le Data Architect pour mettre en œuvre des recommandations d’optimisation des coûts.
• Automatiser les opérations de maintenance des données (ex. Vacuum, optimisation des tables).
Technologies utilisées
• Cloud & Stockage : Azure Data Lake, Azure Blob Storage
• Data Processing : Databricks (PySpark, Delta Lake), Azure Data Factory
• BI & Reporting : Power BI
• Langages : SQL, Python
• IA : Databricks Genie, Copilot
Localisation du poste
Lieu de travail : Boulogne-Billancourt
Vos atouts pour faire la différence
1. Vos atouts pour faire la différence
2. Vous êtes curieux(se), proactif et passionné par l’univers de la data et de l’intelligence artificielle.
3. Vous avez une bonne capacité d’analyse et aimez tester de nouvelles approches pour en mesurer concrètement la valeur.
4. Vous êtes à l’aise avec SQL et Python, et avez un intérêt pour les environnements cloud et les outils modernes de traitement de données comme Databricks.
5. Vous êtes rigoureux, structuré, et avez à cœur de produire un travail fiable et documenté.
6. Vous appréciez le travail en équipe, savez communiquer vos idées et êtes motivé à contribuer à un projet ambitieux et innovant.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.