Description du poste
Taux journalier (TJM): 550
Garantir la fiabilité, la performance, la sécurité et la maîtrise des coûts du socle Azure de SAUR (AKS, Data Platform Databricks, ADF, App Services, VMs, réseau hybride). Définir et industrialiser les pratiques SRE (SLI/SLO/SLA, error budgets, observabilité, automatisation, post-mortems) et contribuer activement à la gouvernance FinOps et à la réduction des dérives de consommation.
Profil recherché
Missions principales :
* Fiabilité & SRE : définition des SLI/SLO/error budgets, revues de fiabilité, gestion des incidents majeurs, post-mortems blameless, plans de remédiation.
* Observabilité : contribution à la plateforme monitoring (Prometheus, Grafana, Loki, Mimir, Alloy), intégration de nouveaux périmètres Azure, dashboards et alerting.
* FinOps & gouvernance Cloud : suivi de la consommation MACC, analyses Azure Resource Graph (KQL), right-sizing, chasse aux ressources orphelines, recommandations d’optimisation.
* Infrastructure as Code : industrialisation via Terraform, modules réutilisables, pipelines GitOPS CI/CD, revues de code et bonnes pratiques IaC.
* Plateforme Kubernetes (AKS) : exploitation, patching, scaling, sécurité (RBAC, Network Policies, Azure AD integration), support aux équipes applicatives.
* Data Platform : accompagnement de la migration ADF v2 vers Databricks, fiabilisation des pipelines et suivi des coûts de compute.
* Automatisation & tooling : scripts Python / PowerShell / Bash, runbooks, self-healing, réduction du toil.
* Sécurité & conformité : application des standards groupe, gestion des secrets (Key Vault), RBAC, Defender for Cloud, PRA/PCA.
* Documentation & partage : runbooks, architecture decision records (ADR), transfert de compétences vers l’équipe et les partenaires (Accenture).
Livrables attendus :
* Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
* Modules Terraform documentés et pipelines CI/CD de déploiement.
* Runbooks d’exploitation et procédures d’incident.
* Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
* Post-mortems des incidents majeurs et suivi des actions correctives.
* Feuille de route d’amélioration continue de la plateforme Azure.
Profil recherché :
• Bac +5 en informatique, systèmes, réseaux ou cloud computing.
• Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2
ans sur un rôle SRE / Platform / Cloud Ops.
• Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate.
• Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée.
• Anglais technique requis (échanges réguliers avec partenaires internationaux).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.