A propos de l'entreprise :
Harry Hope, cabinet de recrutement accompagne candidats et entreprises dans leurs recherches des meilleures opportunités en France et à l'international. Afin de mieux répondre à vos enjeux, tous nos consultants sont spécialisés par secteur d'activité et zone géographique.
A propos du poste :
Nous recrutons pour notre client, une entreprise spécialisée dans le calcul haute performance (HPC), le cloud et l'intelligence artificielle, qui accompagne des organisations de toutes tailles dans la conception, le déploiement et l'exploitation d'infrastructures complexes et critiques.
Dans un contexte de croissance et de structuration, notre client renforce son équipe technique et recrute un Ingénieur Support / SRE expérimenté, afin de garantir la fiabilité, la performance et la continuité opérationnelle des services fournis à ses clients stratégiques.
Le poste est ouvert en 100 % télétravail, partout en France.
Descriptif du poste :
Rattaché(e) à la direction technique, vous évoluez au sein d'une équipe d'experts reconnus dans les domaines du HPC et du cloud. Vous intervenez sur des environnements complexes et exigeants, avec un fort niveau de responsabilité sur la qualité de service, la stabilité des plateformes et l'amélioration continue.
Missions principales :
- Concevoir, déployer et maintenir des infrastructures robustes et performantes (HPC, cloud, IA).
- Mettre en place et faire évoluer les outils de supervision, d'alerting et d'analyse des incidents.
- Piloter les plans d'amélioration continue et d'optimisation technique.
- Intervenir sur la gestion d'incidents complexes et animer, le cas échéant, des cellules de crise.
- Collaborer étroitement avec les équipes de développement sur l'ensemble du cycle de vie des services (RUN / post-mortem / amélioration).
- Garantir un haut niveau de qualité de service et proposer des actions correctives durables.
Profil recherché :
- Formation Bac+5 (Master, école d'ingénieurs) ou Doctorat en informatique, ingénierie ou domaine scientifique connexe.
- 7 à 10 ans d'expérience en support avancé, SRE, RUN ou exploitation d'infrastructures critiques.
- Excellente maîtrise des environnements Linux et des concepts réseaux.
- Solide expérience sur les environnements HPC, cloud et systèmes distribués.
- Très bonne maîtrise du scripting et de l'automatisation (Bash, Python).
- Bonne connaissance des pratiques DevOps / SRE : CI/CD, conteneurisation, Infrastructure as Code.
- Expérience avec Docker, Kubernetes, Terraform, Ansible.
- Connaissances cloud AWS.
- Compréhension des enjeux de cybersécurité, gestion des logs et supervision.
- Une expérience avec des ordonnanceurs de jobs (type Slurm) est un plus.
- Anglais courant exigé (contexte international).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.