Nous recherchons un Site Reliability Engineer expérimenté, avec une approche d’ingénierie forte, capable de faire évoluer la plateforme vers plus de fiabilité, de performance et de maîtrise opérationnelle.
Poste basé à Grenoble – télétravail hybride (2–3 jours / semaine).
Vous intervenez sur deux produits, avec une approche orientée valeur et impact business.
🟢 Pleenk – Plateforme de paiement crypto & identité
Pleenk est une plateforme moderne permettant l’intégration de paiements en cryptomonnaie avec des mécanismes avancés de gestion d’identité et de conformité (KYC, onboarding, traçabilité).
Son ambition est claire : fournir une infrastructure fiable, sécurisée et observable, capable de supporter des flux financiers critiques.
L’infrastructure est pensée comme un produit à part entière : automatisée, mesurable et conçue pour accompagner la croissance rapide du système.
Infra & SRE
* Kubernetes
* CI/CD industrialisée
* Observabilité (logs, métriques, alerting)
* Infrastructure as Code
Les enjeux principaux : fiabilité des flux financiers, sécurité, traçabilité, résilience et scalabilité.
-----------------------------------
🔵 Plateforme marketplace
Plateforme en production depuis plus de 15 ans, avec :
* Trafic élevé
* Volumes de données importants
* Contraintes de disponibilité fortes
* Évolutions fonctionnelles continues
L’enjeu est de faire évoluer l’infrastructure pour accompagner un passage à l’échelle international, tout en garantissant stabilité et performance.
Infra & SRE
* Kubernetes (bare metal)
* CI/CD (Jenkins / GitLab CI)
* PostgreSQL, Elasticsearch
* Systèmes distribués
Les enjeux principaux : scalabilité, performance, disponibilité et maîtrise des coûts d’exploitation.
-----------------------------------
Votre mission
Fiabilité & Résilience
Garantir la disponibilité et la stabilité des systèmes en production.
Définir et suivre les indicateurs de fiabilité (SLA, SLO, SLI).
Améliorer en continu la résilience des systèmes (gestion des pannes, fallback, retry, circuit breakers).
Observabilité & Run
Mettre en place et faire évoluer l’observabilité (logs, métriques, traces).
Améliorer la détection et la résolution des incidents.
Mener des post-mortems orientés amélioration continue.
Réduire le bruit d’alerting et améliorer la pertinence des signaux.
Automatisation & Plateforme
Automatiser l’exploitation et réduire le toil.
Améliorer les pipelines CI/CD et les processus de déploiement.
Faire évoluer les environnements (dev, staging, prod) pour plus de fiabilité et de reproductibilité.
Concevoir des outils internes pour améliorer la productivité des équipes.
Infrastructure & Performance
Faire évoluer Kubernetes et l’infrastructure associée.
Optimiser les performances (latence, ressources, coût).
Opérer et sécuriser les composants critiques (bases de données, services techniques).
Anticiper les problématiques de passage à l’échelle.
Collaboration Produit & Engineering
Travailler en proximité avec les développeurs pour concilier vitesse et fiabilité.
Accompagner les équipes sur les bonnes pratiques (déploiement, monitoring, gestion d’erreurs).
Participer aux choix techniques structurants.
Faire de la plateforme un levier d’accélération produit, pas un frein.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.