Assurer le bon fonctionnement et l'amélioration continue de la plateforme d'observabilité (monitoring, alerting, logs, APM) dans un environnement hybride (on-premise, cloud, SaaS).
Responsabilités principales
1. Support & exploitation : Traitement des incidents et demandes sur les outils d'observabilité (Centreon, Datadog, Grafana, etc.). Escalade et requalification des tickets si besoin.
2. Reporting & amélioration continue : Suivi des SLO, KPI, performance, satisfaction utilisateur. Présentation hebdomadaire des rapports. Automatisation des tâches récurrentes.
3. Documentation & accompagnement : Mise à jour de la documentation. Support aux équipes Dev / Ops sur les bonnes pratiques.
Compétences techniques requises
1. Indispensables : GCP, Centreon, Datadog, OpenTelemetry, Grafana (confirmé). Kubernetes (important).
2. Souhaitables : Terraform, AWX, Helm, Python, GitHub.
Langues
Anglais courant (impératif).
Astreintes possibles
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.