Description du poste
Contexte
Au sein d'une équipe infrastructure d'une plateforme web à fort trafic (plusieurs millions d'utilisateurs actifs), vous intégrez le pôle en charge de l'hébergement, de la résilience et de la sécurité des services exposés sur internet. L'environnement est 100% open source, 100% Infrastructure as Code. Zéro action manuelle en production — tout passe par Git.
La philosophie de l'équipe : "Build it, Run it." Vous concevez, vous industrialisez, vous exploitez.
Missions
* Héberger et scaler les services web fournis par les équipes de développement
* Concevoir et mettre en œuvre des architectures hautement disponibles sur environnements multi-datacenters
* Assurer le déploiement sans interruption de service (zero downtime) en production
* Administrer les clusters Kubernetes : scheduling, Ingress Controllers, exposition de services, montée en charge
* Gérer la résilience inter-datacenters
* Gérer la sécurité de l'exposition internet : anti-DDoS, WAF, gestion des flux
* Administrer l'ensemble du cycle de vie des certificats SSL/TLS
* Gérer les politiques réseau (Network Policies Kubernetes, ouverture de flux via Terraform)
* Assurer la sécurité opérationnelle de l'infrastructure exposée
* Administrer et faire évoluer la stack de supervision à l'échelle (Prometheus fédéré, Grafana, ELK/OpenSearch)
* Maintenir et faire évoluer la registry d'artefacts et d'images Docker (JFrog Artifactory)
* Fournir et maintenir les services d'infrastructure communs aux équipes de développement (métriques, logs, registry, authentification)
* Administrer les mécanismes d'authentification (Keycloak, SSO)
* Gérer l'ensemble des configurations via Puppet
* Contribuer au provisioning infrastructure via Terraform et Ansible
* Développer des scripts d'automatisation (Bash, Python)
* Garantir que toute action en production est tracée, versionnée et reproductible via Git
* Assurer le support de production niveau 3 : troubleshooting système, réseau, performance
* Traiter les chantiers d'obsolescence logicielle sans interruption de service
* Réaliser les actions de patching sur les systèmes critiques
Environnement technique
* Linux (Debian/Ubuntu) — bas niveau système : Expert
* Puppet : Expert
* Terraform : Avancé
* Ansible : Avancé
* Git : Avancé
* Kubernetes : Avancé
* Docker : Avancé
* HAProxy / Traefik / Nginx : Avancé
* DNS — BIND, résolution, types d'enregistrements, TTL : Avancé
* SSL/TLS — PKI, certificats, chiffrement, handshake : Avancé
* Prometheus / Grafana — à l'échelle : Avancé
* ELK / OpenSearch : Confirmé
* JFrog Artifactory : Confirmé
* Keycloak / SSO : Confirmé
* Scripting Bash / Python : Confirmé
* Consul / Netbox : Notions
Conditions de travail
* Localisation : Nancy (Grand Est) — Présentiel majoritaire
* Télétravail : 2 jours par semaine
* Mission longue durée avec vocation d'intégration
* Pas d'astreinte
Profil recherché
1. Ingénieur de production open source avec une compréhension approfondie du système et de l'infrastructure
2. Expérience pratique de l'Infrastructure as Code (IaC)
3. Expérience en environnement à fort trafic et haute disponibilité fortement valorisée
4. Passion technique et démarche autodidacte pour les profils débutants
5. Mindset production : conscience de l'impact réel de chaque action, capacité à travailler sous pression sans filet
6. Veille technique active : lecture, POCs personnels, curiosité démontrée
7. Appétence web : culture open source incarnée, intérêt sincère pour les problématiques d'hébergement web à fort trafic
8. Ancrage géographique : résidence ou projet d'installation solide sur Nancy / Grand Est
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.