I. Contexte : Notre département IT souhaite mettre en place et animer une Communauté de Pratique dédiée à l?observabilité et à la supervision de nos applications métiers. En tant qu?expert Observabilité / Supervision, vous serez chargé de définir et mettre en ?uvre une stratégie d?observabilité complète (monitoring, logs, alerting, tracing) afin de garantir une visibilité en temps réel sur l?état de santé, les performances et le comportement de nos applications. Ces solutions permettront une détection proactive des incidents, un diagnostic rapide des problèmes et assureront la disponibilité de nos services critiques. L?environnement applicatif est hybride, composé de solutions cloud (D365, Power Apps, services Azure, Data product Fabric) et d?applications hébergées on-premise sur serveurs Windows (sites web, serveurs IIS, etc.). II. Missions :
* Référent technique pour contribuer à la construction et à l?implémentation des composants de supervision et des pipelines d?observabilité
* Fournir une expertise et, si nécessaire, participer à la conception, l?intégration et le déploiement des solutions de supervision (dashboards, collecte de logs, tracing, détection d?anomalies basée sur l?IA, etc.)
* Collaborer avec les équipes de développement, d?exploitation et de sécurité pour intégrer les outils et pratiques d?observabilité dans les pipelines CI / CD
* Apporter son expertise lors des incidents et des analyses de causes racines.
* Identifier les besoins spécifiques de chaque équipe et définir des plans d?accompagnement.
* Développer et maintenir des tableaux de bord et rapports pour visualiser les performances applicatives
* Analyser et interpréter les métriques pour identifier les tendances et détecter les problèmes de manière proactive
* Définir la gouvernance, les règles de fonctionnement et les objectifs de la Communauté.
* Mettre en place des outils collaboratifs (wiki, canaux Teams)
* Organiser et animer des sessions de la communauté
* Favoriser les échanges inter-équipes et le partage de connaissances
* Co-construire des standards techniques et des guidelines avec les équipes
* Rédiger des guides de bonnes pratiques et de la documentation technique
* Assurer une veille active sur les technologies et pratiques d?observabilité
* Évaluer et tester de nouveaux outils du marché
* Proposer des POC et des expérimentations innovantes. Profil candidat : III. Compétences techniques attendues : Expertise des concepts d?observabilité (métriques, logs, traces) :
* Expertise : Azure Monitor, Grafana, App Insight
* Outils et plateformes AI Ops (ex. : Azure AI Monitor, Dynatrace, Davis AI, Moogsoft, New Relic AI, DataDog Watchdog, ou solutions similaires)
* Évaluer, recommander et déployer des fonctionnalités d?observabilité pilotées par l?IA pour améliorer l?efficacité opérationnelle et la gestion proactive des incidents.
* Écosystèmes Power Platform (D365, Power Apps, Flux Power Automate)
* Connaissance des plateformes de données basées sur Microsoft Fabric
* Connaissance des environnements Windows on-premise
* Connaissance d?autres solutions comme Prometheus, OpenTelemetry, ELK Stack est un plus. Solide expérience des pratiques DevOps et SRE (Site Reliability Engineering) :
* Maîtrise des technologies de conteneurisation (Docker, Kubernetes)
* Connaissance des pipelines CI / CD avec GitHub Actions ou AzD YAML
* Expérience de l?infrastructure as code (Terraform, Ansible) IV. Soft skills :
* Capacité à fédérer et mobiliser des équipes pluridisciplinaires
* Capacité à animer des groupes de travail et à faciliter des ateliers
* Capacité à vulgariser des concepts techniques complexes
* Autonomie, proactivité et ténacité
* Anglais courant
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.