SRE Network BareMetal H / F / N
Au sein de votre équipe #OneTeam
Au sein du groupe Infrastructure, rejoindre l'équipe en charge de soutenir l'ambition et la croissance d'OVHcloud en mettant à l'échelle, déployant, opérant et gérant toutes les infrastructures réseau, tout en supportant les services réseau associés.
En tant que Site Reliability Engineer, vous contribuerez à construire une plateforme résiliente, scalable et efficiente en réduisant les coûts opérationnels et en favorisant l'excellence des services.
Vos principales responsabilités
* Évaluer et prioriser les incidents affectant l'infrastructure et les plateformes logicielles d'OVHcloud
* Dépanner les problèmes techniques complexes et coordonner les efforts interfonctionnels pour les résoudre
* Proposer et mettre en œuvre les meilleures pratiques pour garantir que les incidents sont traités de manière permanente et ne se reproduisent pas
* Participer aux rotations d'astreinte pour assurer la continuité des services
* Collaborer avec les équipes de développement et d'infrastructure pour éliminer les goulots d'étranglement, améliorer les performances et réduire les coûts opérationnels
* Contribuer aux revues post-incidents et aux post-mortems
* Fournir un support technique aux propriétaires d'applications et aux parties prenantes des pipelines CI / CD
* Travailler dans un environnement d'infrastructure IT fortement orienté réseau
Votre futur impact
Dans 6 mois
1. Vous gérerez les incidents de manière autonome, en apportant des solutions concrètes et durables. Vous aurez contribué activement aux astreintes et maîtrisé nos outils de monitoring.
2. Vous aurez identifié et commencé à résoudre des points faibles précis de l'infrastructure, notamment via des automatisations en Python ou Go.
3. Vous serez un membre essentiel de l'équipe, apportant votre expertise lors des revues post-incidents et soutenant les équipes applicatives.
Et dans 1 an
4. Vous piloterez des projets majeurs pour améliorer la performance et réduire les coûts, en intégrant des solutions SRE avancées et en étant un référent technique.
5. Vos contributions auront un impact direct sur la stratégie d'infrastructure. Vous partagerez votre savoir et contribuerez à faire évoluer les pratiques d'excellence au sein d'OVHcloud.
6. Vous maîtriserez en profondeur l'écosystème réseau et logiciel, capable de résoudre les défis les plus complexes et de proposer des améliorations structurelles.
Compétences requises :
7. Vous maîtrisez l'anglais et le français, tant à l'écrit qu'à l'oral
8. Vous avez une solide connaissance des systèmes internes Unix / Linux
9. Vous êtes compétent en développement logiciel (Python, Go, Perl)
10. Vous avez de l'expérience dans l'exploitation de systèmes distribués
11. Vous êtes familier avec les technologies de conteneurisation (Docker, Kubernetes)
12. Vous avez une bonne compréhension des outils, plateformes et processus liés au CI / CD / CA
13. Vous avez une expérience pratique avec les pipelines de données et les systèmes de messagerie / pub-sub (RabbitMQ, Redis, Kafka)
14. Vous avez une bonne connaissance des outils de monitoring (Prometheus, Grafana) et des meilleures pratiques associées
15. Vous faites preuve d'un solide esprit d'analyse et d'une capacité à résoudre des problèmes complexes.
16. Vous possédez d'excellentes compétences en communication et en collaboration d'équipe
17. Vous êtes enthousiaste à l'idée de travailler sur des infrastructures à grande échelle et à haute disponibilité
C'est un +
18. Vous êtes à l'aise avec les réseaux (la connaissance de VXLAN est un atout)
#J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.