Nous recrutons pour notre client, une entreprise spécialisée dans le calcul haute performance (HPC), le cloud et l'intelligence artificielle, qui accompagne des organisations de toutes tailles dans la conception, le déploiement et l'exploitation d'infrastructures complexes et critiques.
Dans un contexte de croissance et de structuration, notre client renforce son équipe technique et recrute un Ingénieur Support / SRE expérimenté, afin de garantir la fiabilité, la performance et la continuité opérationnelle des services fournis à ses clients stratégiques.
Le poste est ouvert en 100 % télétravail, partout en France.
Descriptif du poste :
Rattaché(e) à la direction technique, vous évoluez au sein d'une équipe d'experts reconnus dans les domaines du HPC et du cloud. Vous intervenez sur des environnements complexes et exigeants, avec un fort niveau de responsabilité sur la qualité de service, la stabilité des plateformes et l'amélioration continue.
Missions principales :
- Concevoir, déployer et maintenir des infrastructures robustes et performantes (HPC, cloud, IA).
- Mettre en place et faire évoluer les outils de supervision, d'alerting et d'analyse des incidents.
- Piloter les plans d'amélioration continue et d'optimisation technique.
- Intervenir sur la gestion d'incidents complexes et animer, le cas échéant, des cellules de crise.
- Collaborer étroitement avec les équipes de développement sur l'ensemble du cycle de vie des services (RUN / post-mortem / amélioration).
- Garantir un haut niveau de qualité de service et proposer des actions correctives durables.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.