Au sein de l'équipe Site Reliability Engineering (SRE), vous assurez le maintien en condition opérationnelle de plateformes critiques à forte disponibilité dans un environnement Cloud et Datacenter.
Vous intervenez sur l'ensemble du cycle de vie des infrastructures, de leur exploitation quotidienne à leur évolution, en passant par l'automatisation, la supervision et la sécurisation des services.
🎯 Vos missions principales :
* Maintenir et faire évoluer les plateformes Linux, Docker et Kubernetes
* Assurer le bon fonctionnement des environnements Cloud et Datacenter
* Garantir la disponibilité, la performance et la fiabilité des services
* Participer à la gestion des incidents et à l'amélioration continue de la production
* Automatiser les opérations et industrialiser les processus d'exploitation
* Développer et maintenir les outils nécessaires au fonctionnement des plateformes
* Mettre en œuvre les bonnes pratiques de sécurité et de conformité
* Participer à la validation des mises en production
* Réaliser et maintenir les tests automatisés de validation ("Smoke Tests")
* Participer aux astreintes et au support des environnements critiques
🛠️ Environnement technique :
Linux, Bash, Docker, Kubernetes, AWS, Azure, Jenkins, Git, Ansible, SaltStack, Grafana, Nagios, Zabbix, PKI, HSM, certificats, sécurité, observabilité.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.