À propos : Artisans contemporains depuis 1837, nous devenons également artisans du code ! Hermès Digital développe, maintient et met à disposition la plateforme e-commerce de la Maison Hermès dans 34 pays à travers le monde.
Dans un contexte dhyper-croissance, et face aux enjeux qui en découlent, nous avons souhaité développer une nouvelle solution e-commerce full-custom et orientée micro-services afin de répondre au mieux aux besoins de nos clients.
Ce projet de grande envergure estune opportunité unique pour créer un systèmee-commerce from scratch. Nous voulons faire ressentir au travers du code et de larchitecture de cette plateforme la qualité et lexcellence que reflètent les créations Hermès.
Pour ce faire, le projet sera mené selon les meilleurs pratiques de conception : TDD, DDD, architecture hexagonale...
Le tout en pair programming pour permettre à chacun dapprendre, de transmettre et dévoluer! Descriptif du poste : En tant que SRE, au sein de léquipe Hermès Digital Infrastructures HDI et sous la responsabilité du Responsable Infrastructure, vous jouerez un rôle essentiel dans la garantie de la fiabilité et des performances des services numériques de notre organisation. Vous travaillerez en étroite collaboration avec léquipe de développement logiciel pour concevoir, mettre en œuvre et entretenir des systèmes répondant à des normes élevées en matière de disponibilité et de performance. Vos responsabilités comprendront la Build et loptimisation de linfrastructure, lObservability des systèmes, lautomatisation des tâches, la gestion des incidents et la collaboration avec les équipes de développement afin daméliorer la fiabilité des services au sein de notre organisation. Vous devrez travailler en étroite collaboration avec léquipe Platform Engineering afin de communiquer vos observations et contribuer à lamélioration des processus et de lutilisation des outils, en tirant parti de votre expérience dans la collaboration avec les équipes de développement logiciel. Vos missions : Un SRE sera intégré à une ou plusieurs équipes de développement (Features teams) et sera donc responsable des Backlog dinfrastructure relatifs à ses équipes. Afin de garantir le bon déroulement de sa mission quotidienne, les SRE est responsable de :
* Gérer les sujets liés à linfrastructure dans les backlogs des équipes de fonctionnalités dont il est responsable. Le SRE travaille en étroite collaboration avec le PO, le Technical Leader et léquipe technique pour comprendre les objectifs de léquipe et définir la stratégie technique locale pour linfrastructure. Le SRE participe aux différents rituels des équipes de fonctionnalités dont il est responsable.
* Gérer la CAF (Capacité A Faire) consolidée pour le Backlog dinfrastructure de chaque équipe de fonctionnalités dont ils sont responsables Le SRE est chargé de prendre en compte la capacité (CAF) avec tous les facteurs liés à ses Backlog en collaboration avec les Product Owners (PO) et les Technical Leaders de ses équipes.
Cela implique de prendre en considération divers aspects tels que les exigences métier et techniques et dautres facteurs pertinents pour prendre les bonnes décisions concernant la gestion des Backlogs.
* Prioriser le traitement des différentes demandes de Build à travers les différents Backlogs Le SRE définit - en collaboration avec les PO et les Technical Leaders - et communique lordre dans lequel les différentes demandes de Build sont exécutées pour ses différents Backlogs.
Cette priorisation garantit que les tâches critiques sont traitées rapidement et dans le bon ordre, contribuant ainsi à la fiabilité globale et aux performances des différents services au sein de notre organisation.
* Garantir la qualité de linfrastructure déployée dans son domaine dactivité Le SRE est responsable de la qualité de linfrastructure quil déploie, y compris sa stabilité, sa sécurité et sa conformité aux meilleures pratiques et aux normes de notre organisation.
* Construire linfrastructure selon les besoins Lorsquune nouvelle infrastructure est nécessaire, le SRE est responsable de sa création et de sa configuration.
Cela peut impliquer la configuration de serveurs, de bases de données, de réseaux ou dautres composants selon les besoins.
* Déléguer les tâches de Build en fonction des compétences et la maturité technique de ses équipes Le SRE évalue lexpertise technique de ses équipes et attribue les tâches de Build en conséquence, veillant à ce que les membres de léquipe travaillent sur des tâches conformes à leurs compétences et à leur expérience. Le SRE sengage dans une démarche de partage des connaissances, par le biais de sessions de peer programming ou autres.
* Valider les Merge Request dInfrastructure as Code (IaC) émanant des Devs Le SRE examine et approuve les modifications apportées au code dInfrastructure as Code (IaC).
Cette étape de validation garantit que les modifications apportées à linfrastructure sont cohérentes avec le code défini et nintroduisent pas de problèmes.
* Développer et maintenir des systèmes de surveillance et dalerte Le SRE crée et gère des systèmes qui surveillent en permanence la santé et les performances des différents services et de linfrastructure.
Il configure également des alertes pour notifier les équipes en cas de problèmes potentiels ou dincidents.
* Collaborer avec les équipes de développement pour améliorer la fiabilité du système Le SRE travaille en étroite collaboration avec les équipes de développement et léquipe de Platform Engineering pour identifier et mettre en œuvre des améliorations visant à renforcer la fiabilité, la disponibilité et les performances des applications.
* Planification et optimisation de la capacité Le SRE évalue la capacité actuelle de linfrastructure et planifient les besoins futurs.
Ils optimisent lallocation des ressources et la scalabilité de linfrastructure pour garantir une utilisation efficace des ressources et une performance optimale des services.
* Création de solutions dautomatisation pour les tâches répétitives Afin de réduire le travail manuel et daméliorer lefficacité, le SRE automatise les tâches courantes, telles que la provision de serveurs ou la gestion des changements de configuration.
* Fournir un soutien et une formation à léquipe de développement Le SRE aide les équipes de développement en offrant un soutien et une formation dans les domaines liés à linfrastructure, à la fiabilité et aux meilleures pratiques.
* Gérer et répondre efficacement aux incidents Le SRE est responsable de la gestion et de la réponse aux incidents, veillant à ce que les problèmes soient résolus rapidement pour minimiser les temps darrêt et les interruptions.
* Identifier et atténuer les goulets détranglement du système et les problèmes de performances Le SRE identifie proactivement les goulets détranglement et les problèmes de performances au sein du système et prend des mesures pour les résoudre afin de maintenir des performances optimales du système. Le SRE, en collaborant avec les Développeurs, contribue activement aux tests de performance pour identifier et résoudre proactivement les goulets détranglement potentiels et les problèmes de performances.
* Établissement et promotion des meilleures pratiques en ingénierie de la fiabilité Le SRE promeut et met en œuvre les meilleures pratiques dans le domaine de lingénierie de la fiabilité, encourageant une culture damélioration continue.
* Conformité en matière de sécurité Le SRE Veille à ce que linfrastructure respecte les normes de conformité en matière de sécurité.
* Planification du Disaster Recovery Plan Développer et maintenir des plans de reprise après sinistre pour minimiser les temps darrêt en cas de défaillance du système.
* Optimisation des coûts Le SRE est responsable de la surveillance et de loptimisation des coûts de linfrastructure, y compris lallocation et lefficacité dutilisation des ressources.
* Documentation Le SRE est responsable de la rédaction et de la mise à jour de la documentation relative à linfrastructure, aux processus et aux meilleures pratiques pour faciliter le partage des connaissances et lintégration des nouveaux membres de léquipe. Environnement technique :
* Orchestration et conteneurs : Kubernetes, Docker
* Gestion des configurations : Ansible
* Architecture événementielle : SQS, SNS, Kafka
* Moteur de recherche : ElasticSearch
* Bases de données : Postgresql, MySQL, MongoDB
* Observabilité : Prometheus, Thanos, Loki, Tempo, Grafana
* Security : HashiCorp Vault, OKTA Bénéfices pour vous : Vous rejoignez la Maison Hermès, artisan de produits dexception! Vous êtes au cœurdun projet from scratch passionnant Vous intégrez une équipe bienveillante soucieuse de la qualité de son code et de lévolution de ses membres, Vous bénéficiez dunegrande autonomieet vos prises dinitiatives sont encouragées. Profil recherché : Compétences Techniques :
* Vous avez au minimum 3 ans dexpérience professionnelle en tant que SRE.
Vous êtes adepte des méthodes agiles, méthodologie SRE et GitOps.
* Vous avez une maîtrise approfondie de la plateforme AWS, Docker et Kubernetes (EKS).
* Lobservabilité (Prometheus, Thanos, Loki, Tempo, Grafana)
* La création denvironnements et la sécurité nont pas de secret pour vous.
* Vous avez déjà mis en place et maintenu des services communs, tels que Authorization Server (OpenID provider) Event Bus / Messaging. Vault Vous pratiquez couramment lAnglais (à lécrit et à loral). Compétences Comportementales : Vous avez un excellent sens relationnel et vous êtes bon communicant.
Vous avez une bonne capacité dadaptation, le souci du résultat, le sens du service et lesprit déquipe.
Vous êtes curieux et rigoureux.
Enfin, vous avez lenvie et la capacité dauto-apprentissage, vous cherchez à vous améliorer en continu! Employeur responsable, nous nous engageons dans léthique, les diversités et linclusion.
Rejoignez laventure humaine Hermès !
Créer une alerte emploi pour cette recherche
J-18808-Ljbffr
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.