Descriptif du poste
Site Reliability Engineer - F/H/N
Au sein de votre équipe #OneTeam
* Rejoindre l'équipe Digital Tools, responsable de la chaîne de déploiement, de l'observabilité et des opérations des plateformes OVHcloud (sites e-commerce et espace client).
* Jouer un rôle central dans la mise en production et la fiabilité des services exposés à des millions d'utilisateurs.
Vos principales responsabilités
* Concevoir et maintenir les pipelines de déploiement (CI/CD) pour assurer des livraisons fiables et rapides.
* Piloter le provisioning et la gestion de l'infrastructure (bare metal, VM, containers) via l'Infrastructure as Code (IaC).
* Orchestrer les workloads sur Kubernetes en garantissant la scalabilité et la résilience des services.
* Assurer l'amélioration continue de l'observabilité (métriques, logs, alerting, dashboards, post-mortems).
* Automatiser les opérations récurrentes pour réduire la charge opérationnelle et renforcer la stabilité.
* Contribuer à la définition des standards d'architecture et des bonnes pratiques de déploiement.
* Participer aux astreintes et à la gestion des incidents de production pour apporter une réponse structurée.
Votre futur impact
Dans 6 mois
* Vous aurez pris en main l'écosystème Kubernetes et les pipelines CI/CD existants de l'équipe Digital Tools.
* Vous aurez contribué à l'automatisation d'au moins un processus opérationnel majeur pour réduire les interventions manuelles.
* Vous serez pleinement intégré au cycle des astreintes et capable de diagnostiquer les incidents sur les plateformes e-commerce.
Et dans 1 an
* Vous deviendrez le référent technique sur l'évolution des outils d'observabilité et de monitoring (Prometheus, Grafana).
* Vous aurez piloté la mise en œuvre de nouveaux standards d'Infrastructure as Code impactant l'ensemble de la chaîne de livraison.
* Vous proposerez des optimisations architecturales innovantes pour améliorer la résilience globale des services face à de fortes montées en charge.
Compétences requises :
* Vous justifiez d'une expérience de 5 ans minimum dans un rôle d'ingénieur infrastructure, SRE ou DevOps.
* Vous maîtrisez les outils d'IaC et de gestion de configuration comme Ansible, Puppet ou Terraform.
* Vous possédez une expertise avancée en Kubernetes, Docker et les architectures Cloud Native (Helm, Mesh).
* Vous concevez et exploitez des pipelines CI/CD complexes (GitLab CI, GitHub Actions, ArgoCD).
* Vous gérez couramment les outils d'observabilité tels que Prometheus, Grafana ou Sentry.
* Vous développez des scripts d'automatisation en Go, Python ou Bash.
* Vous parlez et écrivez un anglais technique fluide pour collaborer dans un contexte international.
C'est un +
* Vous avez déjà travaillé sur des plateformes e-commerce à très fort trafic.
Cette offre ne répond pas tout à fait à vos attentes ? Candidatez malgré tout !
C'est l'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.
Cette offre ne répond pas tout à fait à vos attentes ? Candidatez spontanément sur le portail candidat pour rejoindre l'une de nos équipes !
L'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.