Nous recrutons un Ingénieur de Production / Supervision pour accompagner nos équipes SRE, renforcer la fiabilité des systèmes et anticiper les incidents grâce à une supervision proactive
- Concevoir et mettre en place les solutions de supervision des différentes plateformes
- Echanger avec les BU et les différents experts pour améliorer la résilience des systèmes.
- Assurer le support Niveau 3 des outils de supervision pour garantir une surveillance efficace et proactive.
- Contribuer, en tant qu'acteur clé, à la résolution des incidents majeurs et critiques et à l'analyse des problèmes complexes
- Accompagner les équipes d'exploitation SRE dans la réalisation de leur activité quotidienne (remédiation manuelle, check du matin, support N1 et N2…)
- Analyser les données de supervision (logs, évènements, incidents…) pour détecter les anomalies, diagnostiquer les problèmes et anticiper les incidents.
- Contribuer à l'automatisation et l'industrialisation de l'écosystème
Profil :
Maîtrise des outils de supervision (Dynatrace, Zabbix, Grafana, etc.). (Connaissance de l'exploitation/configuration de ces outils et pas seulement utilisation)
Connaissance approfondie des environnements Linux/Windows.
Solides compétences en scripting (Bash, Python, PowerShell, etc.).
Forte expérience en milieu de Production et sur un contexte similaire
Capacité à analyser des données techniques complexes et à résoudre des problèmes en temps réel.
Excellentes compétences en communication et capacité à travailler en équipe.
Informations :
Votre future dream team: Vous rejoindrez l'équipe Site Reliabilty and Operations de la direction Infrastructure and Operations
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.