Nous recherchons un Site Reliability Engineer expérimenté, capable de garantir la disponibilité, la performance et la résilience de la plateforme. Votre rôle est d’appliquer une approche ingénierie à l’exploitation : automatiser au maximum, réduire le toil, améliorer la fiabilité du système et accompagner les équipes produit dans un delivery sûr et maîtrisé. Vous travaillez en proximité avec les développeurs pour faire évoluer le système sans compromettre la stabilité. Vos missions : Garantir la fiabilité et la disponibilité de la plateforme (SLA, incidents, amélioration continue). Mettre en place et faire évoluer la supervision, l’alerting et l’observabilité (logs, métriques). Gérer le run : analyse d’incidents, post-mortems, actions correctives. Automatiser l’exploitation et réduire le toil. Faire évoluer l’infrastructure Kubernetes et les environnements (dev, staging, prod). Déployer et opérer les composants critiques (bases de données, services techniques). Contribuer à la sécurité opérationnelle (accès, secrets, bonnes pratiques). Collaborer avec les équipes produit pour concilier vitesse de delivery et fiabilité .
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.