Publiée le 16 juin
Mission du poste
Salaire: 42000-55000 Ce que nous recherchons : SOFTEAM Digital recherche un(e) Ingénieur SRE (Site Reliability Engineering) afin d’accompagner l’exploitation et l’amélioration continue de plateformes critiques à forte disponibilité. Vous intégrerez une équipe SRE en charge de garantir la fiabilité, la performance, la sécurité et l’évolutivité des services. Vous gérez la production opérationnelle d'applications critiques en haute disponibilité. Vous assurez la gestion du quotidien de la production, des évolutions techniques et fonctionnelles, des incidents, et le reporting dans le respect des SLA. Vous vous intégrez dans une démarche d'anticipation et d'industrialisation des processus et outils. Ce qui vous attend / vos missions : Participer à la maintenance et l'évolution des plateformes dans un contexte Linux/Kubernetes/Docker Gérer différents environnements Cloud privé Sécuriser les plateformes (Design, implémentation, configuration) et développer des outils ou adaptation de solutions en relation avec la production de services Améliorer le monitoring technique et fonctionnel des plates-formes Piloter et maintenir en condition opérationnelle les plateformes en s'assurant de leur disponibilité et performance Fournir une expertise technique sur les produits et fournir le support adéquat aux clients internes/externes Fournir un support et une assistance continue aux clients (24/7) – capacité à participer à des cycles d’astreintes Environnement technique : Linux / Unix Kubernetes, Docker AWS, Azure Bash, scripting Git, Jenkins, Ansible, SaltStack Grafana, Zabbix, Nagios Réseaux et architectures distribuées PKI, cryptographie, cryptographie, HSM CI/CD et automatisation Monitoring et observabilité Formation supérieure en informatique (Bac5, école d’ingénieur ou université) Minimum 5 ans d’expérience en exploitation, production, infrastructure, DevOps ou SRE Expérience significative sur des environnements de production critiques à haute disponibilité Bonne maîtrise des environnements Linux et des technologies de conteneurisation Connaissance des environnements Cloud et des outils d’automatisation Expérience dans la gestion d’incidents et l’amélioration continue des services Atouts complémentaires Certification Kubernetes (CKA) Connaissances Java et SQL Architecture API et microservices Pratiques ITIL Normes de sécurité des systèmes d’information (ISO 27001) Expérience dans les environnements de confiance numérique et de cybersécurité Collective.work est la plateforme de recrutement nouvelle génération pour trouver votre prochain emploi. Fort d'une grande expertise dans l'IA, Collective.work permet de mieux cibler les offres et leurs candidats correspondants, créant ainsi un système beaucoup plus fluide que les acteurs traditionnels. Plus de 10,000 recruteurs utilisent Collective, permettant à des dizaines de milliers de candidats de trouver leur futur emploi chaque jours