Publiée le Il y a 21 h
Mission du poste
Dans un environnement critique et fortement orienté qualité de service, nous recherchons un Ingénieur SRE / DevOps Support pour assurer le RUN, le diagnostic et le support avancé de plateformes applicatives et techniques.
Le poste s'inscrit dans un contexte industriel exigeant, où la disponibilité des systèmes, la traçabilité et la réactivité sur incidents sont essentielles.
Missions principales :
Vous intervenez en tant que support technique de niveau 2/3 sur des environnements de production et de plateformes DevOps.
Vos principales responsabilités :
- Assurer le diagnostic et l'analyse d'incidents à distance sur des environnements Linux / Cloud
- Exploiter les outils de supervision et d'observabilité (logs, métriques, traces)
- Analyser les logs applicatifs et systèmes (ELK / stack de monitoring)
- Identifier les causes racines des incidents et proposer des plans de correction (RCA)
- Suivre et traiter les incidents via outils ITSM (ServiceNow, Jira…)
- Participer au maintien en conditions opérationnelles (MCO) des plateformes
- Collaborer avec les équipes infra, DevOps et applicatives
- Documenter les incidents, solutions et bonnes pratiques
- Contribuer à l'amélioration continue de la qualité de service
Environnement Technique :
- Systèmes : Linux (principalement), Windows
- Conteneurisation : Docker, Kubernetes
- Observabilité : ELK (Elastic Stack), Grafana, Prometheus, Loki
- Cloud : AWS / Azure (selon environnements)
- Automatisation : Ansible (et notions Terraform appréciées)
- CI/CD : Bitbucket pipelines ou équivalent
- Outils ITSM : ServiceNow, Jira
- Virtualisation : VMware
Profil :
Techniques :
- Administration système Linux
- Analyse de logs et troubleshooting avancé
- Notions solides DevOps / Kubernetes
- Compréhension des architectures applicatives
- Supervision et monitoring (Grafana / ELK)
Fonctionnelles :
- Esprit d'analyse et de diagnostic
- Culture du RUN et de la disponibilité
- Rigueur et respect des processus qualité
- Capacité à travailler en environnement critique
- Bonne communication et reporting incident