Site reliability engineer expérimenté

Grenoble

CDI

hyperweb

Publiée le 22 mars

Description de l'offre

Nous recherchons un Site Reliability Engineer expérimenté, avec une approche d’ingénierie forte, capable de faire évoluer la plateforme vers plus de fiabilité, de performance et de maîtrise opérationnelle.

Poste basé à Grenoble – télétravail hybride (2–3 jours / semaine).

Vous intervenez sur deux produits, avec une approche orientée valeur et impact business.

🟢 Pleenk – Plateforme de paiement crypto & identité

Pleenk est une plateforme moderne permettant l’intégration de paiements en cryptomonnaie avec des mécanismes avancés de gestion d’identité et de conformité (KYC, onboarding, traçabilité).

Son ambition est claire : fournir une infrastructure fiable, sécurisée et observable, capable de supporter des flux financiers critiques.

L’infrastructure est pensée comme un produit à part entière : automatisée, mesurable et conçue pour accompagner la croissance rapide du système.

Infra & SRE

* Kubernetes

* CI/CD industrialisée

* Observabilité (logs, métriques, alerting)

* Infrastructure as Code

Les enjeux principaux : fiabilité des flux financiers, sécurité, traçabilité, résilience et scalabilité.

-----------------------------------

🔵 Plateforme marketplace

Plateforme en production depuis plus de 15 ans, avec :

* Trafic élevé

* Volumes de données importants

* Contraintes de disponibilité fortes

* Évolutions fonctionnelles continues

L’enjeu est de faire évoluer l’infrastructure pour accompagner un passage à l’échelle international, tout en garantissant stabilité et performance.

Infra & SRE

* Kubernetes (bare metal)

* CI/CD (Jenkins / GitLab CI)

* PostgreSQL, Elasticsearch

* Systèmes distribués

Les enjeux principaux : scalabilité, performance, disponibilité et maîtrise des coûts d’exploitation.

-----------------------------------

Votre mission

Fiabilité & Résilience

Garantir la disponibilité et la stabilité des systèmes en production.
Définir et suivre les indicateurs de fiabilité (SLA, SLO, SLI).
Améliorer en continu la résilience des systèmes (gestion des pannes, fallback, retry, circuit breakers).

Observabilité & Run

Mettre en place et faire évoluer l’observabilité (logs, métriques, traces).
Améliorer la détection et la résolution des incidents.
Mener des post-mortems orientés amélioration continue.
Réduire le bruit d’alerting et améliorer la pertinence des signaux.

Automatisation & Plateforme

Automatiser l’exploitation et réduire le toil.
Améliorer les pipelines CI/CD et les processus de déploiement.
Faire évoluer les environnements (dev, staging, prod) pour plus de fiabilité et de reproductibilité.
Concevoir des outils internes pour améliorer la productivité des équipes.

Infrastructure & Performance

Faire évoluer Kubernetes et l’infrastructure associée.
Optimiser les performances (latence, ressources, coût).
Opérer et sécuriser les composants critiques (bases de données, services techniques).
Anticiper les problématiques de passage à l’échelle.

Collaboration Produit & Engineering

Travailler en proximité avec les développeurs pour concilier vitesse et fiabilité.
Accompagner les équipes sur les bonnes pratiques (déploiement, monitoring, gestion d’erreurs).
Participer aux choix techniques structurants.
Faire de la plateforme un levier d’accélération produit, pas un frein.

Postuler

Créer une alerte

Sauvegarder

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.