Contexte Renfort d’une équipe Ops/Support en charge de l’exploitation d’un portail d’information voyageurs à fort trafic, au sein d’un domaine orienté RUN / fiabilité / performance. Objectifs de la mission Assurer l’exploitation et la disponibilité des applications (RUN) Déployer en préproduction et production les livrables fournis par le CDS Participer au diagnostic / debug lors d’incidents Contribuer, avec le PO technique, à des chantiers de rebuild/refactoring (scalabilité optimisation des coûts) Porter une vision RUN (amélioration continue, priorisation, qualité de service) Missions principales Suivi QoS, monitoring/supervision, analyse et résolution d’incidents Pilotage des incidents majeurs et des événements impactant la production Garant de la cohérence de bout en bout des environnements (dev/preprod/prod) Industrialisation et automatisation des processus (approche DevOps) Accompagnement des équipes support et contribution à la documentation (procédures, runbooks) Participation aux rituels agiles et aux tâches du backlog Stack technique Technos principales : Kubernetes, AWS, Terraform, Helm, FluxCD, Datadog, GitLab CI, Docker Environnement : Cloudflare, Keycloak, Contour Secondaires : MongoDB, Java, Postman Profil candidat: Compétences clés (obligatoires) Kubernetes AWS Terraform Datadog Solide expérience RUN / production (incidents, supervision, astreintes, amélioration continue) Atouts (nice to have) GitOps (FluxCD), Helm, GitLab CI Expérience optimisation coûts / performance sur AWS Culture SRE / réduction de la toil, automatisation, observabilité avancée
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.