⚠️ Recherche exclusivement localisée dans la région Hauts-de-France (Nord). Objectif global Participer à la construction et à l’évolution d’une plateforme d’observabilité permettant de superviser, analyser et améliorer la performance et la disponibilité d’applications déployées dans des environnements cloud et on-premise. Contexte de la mission Vous intervenez au sein d’une équipe dédiée à l’ Observabilité, chargée de concevoir et d’opérer une plateforme regroupant plusieurs solutions de monitoring, dashboarding, alerting, gestion des logs et APM. La plateforme s’appuie principalement sur des technologies open source opérées en interne, notamment autour de l’écosystème OpenTelemetry et Grafana. Elle est utilisée par des équipes techniques internationales afin d’améliorer la fiabilité, la performance et la supervision de leurs applications. Missions principalesConception et construction de la plateforme Contribuer au design et à l’architecture de la plateforme d’observabilité. Intégrer, configurer et déployer les composants techniques de la stack. Participer à la mise en place des standards et bonnes pratiques d’observabilité. Déploiement et industrialisation Mettre en œuvre le templating, le déploiement et le paramétrage des outils. Assurer l’ industrialisation et l’automatisation des processus d’exploitation. Participer à l’amélioration continue de la plateforme. Exploitation et support Administrer les outils de la plateforme et gérer les incidents ou problèmes. Accompagner les équipes dans l’ instrumentation de leurs applications et l’exploitation des données d’observabilité (logs, métriques, traces). Contribuer à l’amélioration de la disponibilité et des performances des applications. Documentation et diffusion des bonnes pratiques Rédiger des ADR, documentations techniques et runbooks. Participer à la diffusion de la connaissance auprès des équipes techniques. Compétences techniques requisesImpératif – Niveau Confirmé Stack Grafana OSS (Loki, Mimir, Tempo, Alloy…) OpenTelemetry Important – Niveau Expert Kubernetes Souhaitable Datadog Environnement technique Kubernetes avancé Plateforme Grafana opérée à grande échelle OpenTelemetry (collecte, instrumentation, pipelines) Infrastructure cloud (principalement GCP, Azure serait un plus) Infrastructure as Code : Terraform Automatisation : AWX Programmation / scripting : Python ou Go (un plus) Connaissances complémentaires Architecture cloud et sécurité Instrumentation d’applications Culture SRE et gestion des SLO Compétences linguistiques Anglais professionnel – impératif Profil candidat: Profil recherchéExpérience 5 ans d’expérience minimum dans des environnements cloud et plateformes techniques. Dont au moins 3 ans sur des sujets d’observabilité. Qualités attendues Autonomie et rigueur Forte capacité d’analyse et de résolution de problèmes Bonnes compétences rédactionnelles Aisance relationnelle pour accompagner les équipes techniques Curiosité technique et sens de l’amélioration continue ⚙️ Contraintes de la mission Participation à un roulement d’astreintes. Travail dans un contexte international, nécessitant l’usage de l’anglais.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.