Nous recherchons un(e) Site Reliability Engineer (SRE) expérimenté(e) pour renforcer nos équipes et garantir la fiabilité, la performance et la scalabilité de notre plateforme. Vos missions Vous serez responsable de la disponibilité et de la qualité de service de nos systèmes en production. À ce titre, vous interviendrez sur la gestion des incidents de bout en bout (analyse des causes racines, mise en place de correctifs et actions de prévention), ainsi que sur l'amélioration continue de l'observabilité. Vous contribuerez activement à l'automatisation des opérations et du support, notamment via des approches software et l'usage d'outils innovants (dont l'IA appliquée aux Ops). Vous travaillerez en étroite collaboration avec les équipes de développement, DevOps et sécurité, en apportant votre expertise pour améliorer la fiabilité, la performance et la sécurité des systèmes, tout en influençant les bonnes pratiques techniques. ️ Environnement technique Vous évoluerez dans un environnement moderne basé sur GCP, Kubernetes et des infrastructures automatisées. Vous utiliserez notamment Linux, Python, Terraform et Datadog pour le monitoring et l'observabilité. L'écosystème de développement repose sur GitHub et GitHub Actions. Des connaissances solides en réseau et en sécurité (WAF, protection DDoS) sont attendues. Pourquoi nous rejoindre Vous interviendrez sur des sujets à fort impact, au cœur de la fiabilité de la plateforme, avec une réelle autonomie et la possibilité de mettre en place des améliorations structurantes.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.