Contexte et objectif de la mission
Dans le cadre de l'exploitation et du support de plusieurs produits basés sur des infrastructures Kubernetes, la mission consiste à intervenir comme consultant Ops senior, avec un double rôle d'expert technique et de manager opérationnel. Les produits concernés sont des APIs LLM as a Service exposées à des utilisateurs internes et/ou externes, avec de fortes exigences de disponibilité et de fiabilité. Le consultant encadrera une équipe de 5 personnes basée en Inde, en charge du support de ces produits, et sera garant de la qualité de service en production.
Mission principale
Volet technique (Run & Support)
• Garantir la stabilité, la performance et la disponibilité des environnements Kubernetes en production
• Administrer et faire évoluer des configurations Kubernetes sur mesure, sans dépendance à des solutions managées ou prépackagées
• Diagnostiquer et résoudre des incidents complexes : troubleshooting réseau, scheduling, ressources, RBAC
• Intervenir sur les composants cœur de Kubernetes : configuration des clusters, gestion des CRDs, networking (CNI), stockage persistant, ingress/controllers
• Mettre en place et améliorer les pratiques de monitoring, d'alerting et d'observabilité de la plateforme
• Contribuer ponctuellement à des activités de build/CI-CD selon la disponibilité, sans que cela constitue la priorité du rôle
Volet management
• Encadrer et animer une équipe de 5 personnes en Inde dédiée au support des produits
• Organiser la charge de travail, prioriser les incidents et garantir le respect des SLAs
• Assurer la montée en compétence de l'équipe sur les sujets Kubernetes
• Être l'interlocuteur principal entre l'équipe support et les autres parties prenantes : produit, architecture, clients internes
• Mettre en place des rituels de pilotage : reporting, points d'équipe, post-mortems d'incidents
Environnement technique
• Kubernetes : administration avancée, configuration fine, troubleshooting de niveau expert
• Conteneurisation : Docker ou équivalent
• Monitoring / observabilité : Prometheus, Grafana ou équivalents
• Infrastructure as code appréciée : Helm, Terraform
• Connaissance des architectures API / LLM as a Service appréciée
Profil recherché
• Expertise confirmée et approfondie de Kubernetes, au-delà de l'usage standard, avec capacité à modifier des configurations complexes et à adapter le comportement du cluster sans solution prépackagée
• Expérience significative en environnement de production critique, en run & support et gestion d'incidents
• Expérience managériale avérée, idéalement à la tête d'une équipe technique
• Excellent niveau d'anglais, écrit et oral, indispensable
• Expérience confirmée de collaboration avec des équipes basées en Inde : gestion interculturelle, décalage horaire, modes de communication
• Appétence pour les sujets IA/LLM appréciée, sans être un prérequis technique
• Capacité à équilibrer rigueur opérationnelle et leadership d'équipe
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.