Vos missions en quelques mots En tant que Lead SRE Compute & Orchestration, vous concevez, déployez et opérez l'ensemble de la stack compute. Vos missions incluent : • Provisionnement & inventaire : mettre en œuvre l'automatisation complète (e.g., Tinkerbell, MAAS, Ironic, Netbox ou équivalents) ; • Firmware & BMC : maîtriser, durcir et automatiser la couche firmware ; • OS & Images : produire et déployer les images OS durcies ; • Virtualisation : implémenter et exploiter la couche de virtualisation (OpenStack, Incus, KubeVirt ou équivalent) en garantissant isolation et résilience ; • Kubernetes : opérer les clusters (control plane, workers, etcd) et assurer leur reconstruction rapide ainsi que la résilience multi-sites ; • Reproductibilité : garantir des builds et déploiements déterministes, versionnés, auditables ; • Sécurité : implémenter le durcissement à toutes les couches (firmware, OS, runtime) et contribuer à la chaîne de confiance boot-to-workload ; • Documentation : rédiger les procédures d'exploitation et la documentation technique ; • Pilotage : conduire l'exploitation par les SLO, error budgets et RETEX ; • Équipe : encadrer techniquement les ingénieurs ; contribuer au recrutement et à la montée en compétences. Profil recherché Nous cherchons un expert infrastructure compute confirmé (10 ans d'expérience en production), capable de concevoir et opérer les couches basses d'une plateforme critique, avec une approche SRE et une sensibilité sécurité. Vous possédez de l'expérience professionnelle : • Exploitation en production, en mode SRE, de plateforme d'hébergement à grande échelle : gestion d'incidents, astreintes, pilotage par SLO/SLI ; • Maîtrise opérationnelle d'au moins une solution d'orchestration de compute en production : ◦ Soit virtualisation : OpenStack, Incus ou équivalent avec gestion multi-cluster, isolation et résilience ; ◦ Soit Kubernetes : déploiement et exploitation de clusters multi-sites avec leur gestion centralisée (Rancher ou équivalent) ; • Provisionnement bare metal à grande échelle ; • Culture SRE : automatisation, observabilité, RETEX et amélioration continue. Vous disposez également des compétences techniques suivantes : • Expertise pointue attendue sur l'un des deux domaines (VM ou Kubernetes), le second étant couvert par un recrutement complémentaire ; • Maîtrise fonctionnement Linux et expérience des OS immutables ou durcis ; • Expertise d’un OS déclaratif ou et d’un langage d'infrastructure as code (Terraform, Ansible, Helm) ; • Maîtrise d'au moins un langage de programmation (Go ou Python) : être capable d’implémenter des routines d’orchestration (contrôleurs) ; • Très bonne connaissance des questions de sécurité et de durcissement (firmware, OS, runtime), capacité à dialoguer avec une chaîne SSI. Vous êtes : • Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité. • Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques • Ancreé dans une culture d'analyse factuelle et d'amélioration continue ; Atouts appréciés : • Expérience d'environnements multi-sites / multi-régions ; • Expérience avec des environnements air-gapped ; • Connaissance de SecNumCloud et IGI 1300 ; • Contributions open source. Éléments de candidature Documents à transmettre Pour postuler à cette offre, l'envoi du CV et d'une lettre de motivation est obligatoire Personnes à contacter dc-dirisi-sdorh-rrh-gpc-gpec.mobilite.fct@intradef.gouv.fr laurent.prosperi@intradef.gouv.fr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.