[s3ns] sre monitoring & observability (h/f) (cdi)

Paris

CDI

Golden Bees

Publiée le 3 mai

Description de l'offre

Depuis plus de vingt ans, Thales déploie de façon proactive une politique affirmée en matière de responsabilité d'entreprise fondée sur les standards internationaux les plus élevés. Celle ci est en parfait accord avec la raison d'être que l'entreprise a adoptée en 2020, Construisons ensemble un avenir de confiance. À travers cette démarche, le Groupe répond aux demandes de ses clients, de ses collaborateurs, des investisseurs et des marchés financiers pour une entreprise toujours plus performante, innovante et consciente de ses responsabilités. Il s'inscrit également dans les évolutions actuelles structurantes de la société pour une relation plus transparente et de confiance entre les entreprises et l'ensemble de leurs parties prenantes. QUI SOMMES-NOUS ? S3NS est né du partenariat industriel entre Thales, leader mondial de la cyber sécurité, et Google Cloud, leader mondial des solutions cloud. Nous avons pour ambition d'offrir le meilleur des deux mondes à l'ensemble des organisations soucieuses de protéger leurs données sensibles (institutions publiques, OIV, OSE...). C'est-à-dire une solution équivalente à Google Cloud Platform (incluant à la fois les services IaaS et PaaS de GCP) et respectant les exigences du label SecNumCloud. Une première offre, 'Contrôles locaux avec S3NS', est déjà disponible depuis février 2023 pour permettre à nos clients de bénéficier d'un premier niveau de transparence et contrôles additionnels, et d'accélérer la trajectoire vers le cloud de confiance. Rattaché au responsable de l'équipe Engineering S3NS, vous aurez pour missions : * Maintenir et faire évoluer la stack de monitoring des infrastructures S3NS on prem: Zone de Service Partagées et Partner Space * Assurer le suivi et le respect des engagements de disponibilité de ces stacks de monitoring (SLI, SLO, SLA) envers Google et les équipes S3NS. * Fournir des recommandations (règles de nommage, granularité...) permettant une utilisation homogène de cette stack de monitoring et supporter les équipes dans la mise en oeuvre de leur métriques, dashboard, alertes. * Participer aux astreintes de l'équipe PS Platform, assurer la réponse aux incidents, contribuer aux post-mortems et plans de prévention. * Automatiser les tâches d'exploitation récurrentes via scripts et pipelines CICD * Contribuer aux autres périmètres de l'équipe Platform: IaaS/KaaS/CICD Périmètre Technique : * Métriques: Prometheus / Mimir * Dashboard: Grafana * Logs: Loki * Alerting & on-call: Alertmanager, Signl4 Votre profil : Vous disposez d'un bac+5 en informatique avec 3 ans d'expérience minimum sur un poste similaire. Vous maitrisez : * les concepts SRE: disponibilité, fiabilité, SLA/SLO/SLI, error budget, on-call, post-mortem blameless * La stack k8S on-prem: CNI, gestion du storage, gestion des clusters * La Maîtrise des composants de la stack monitoring / observabilité La gestion du stress et des incidents, une communication claire et un esprit d'analyse et de résolution de problèmes complexes sont des atouts que l'on vous reconnait? Alors ce poste est fait pour vous! Rattaché au responsable de l'équipe Engineering S3NS, vous aurez pour missions : * Maintenir et faire évoluer la stack de monitoring des infrastructures S3NS on prem: Zone de Service Partagées et Partner Space * Assurer le suivi et le respect des engagements de disponibilité de ces stacks de monitoring (SLI, SLO, SLA) envers Google et les équipes S3NS. * Fournir des recommandations (règles de nommage, granularité...) permettant une utilisation homogène de cette stack de monitoring et supporter les équipes dans la mise en oeuvre de leur métriques, dashboard, alertes. * Participer aux astreintes de l'équipe PS Platform, assurer la réponse aux incidents, contribuer aux post-mortems et plans de prévention. * Automatiser les tâches d'exploitation récurrentes via scripts et pipelines CICD * Contribuer aux autres périmètres de l'équipe Platform: IaaS/KaaS/CICD Périmètre Technique : * Métriques: Prometheus / Mimir * Dashboard: Grafana * Logs: Loki * Alerting & on-call: Alertmanager, Signl4 Votre profil : Vous disposez d'un bac+5 en informatique avec 3 ans d'expérience minimum sur un poste similaire. Vous maitrisez : * les concepts SRE: disponibilité, fiabilité, SLA/SLO/SLI, error budget, on-call, post-mortem blameless * La stack k8S on-prem: CNI, gestion du storage, gestion des clusters * La Maîtrise des composants de la stack monitoring / observabilité La gestion du stress et des incidents, une communication claire et un esprit d'analyse et de résolution de problèmes complexes sont des atouts que l'on vous reconnait? Alors ce poste est fait pour vous!

Postuler

Créer une alerte

Sauvegarder

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.