Nous rejoindre c'est intégrer un groupe humain ayant pour domaines d'expertise :
- Intelligence Artificielle et Big Data
- Conseil & Audit
- Infrastructure et cloud
- Applications digitales
- SSI/Cyber sécurité
- Digitalisation de la production
Nous puisons notre force dans une équipe composée de femmes et d'hommes passionnés et ambitieux, toujours prêts à relever de nouveaux défis !
Ecoute, proximité, réactivité et efficacité se retrouvent dans notre management quotidien, ce sont ces valeurs qui contribuent à notre réussite collective.
Contexte de la mission
Dans le cadre de la mise en place du standard Groupe autour des plateformes IoT, nous recherchons un Ingénieur Production & Observabilité IoT afin d'accompagner le déploiement et l'exploitation de la future plateforme basée sur la solution ThingsBoard.
Cette plateforme a pour objectif de fournir une première instance opérationnelle, industrialisée et interconnectée, conforme aux standards IoT du Groupe et aux exigences métiers en matière de disponibilité, sécurité et qualité de service.
L'ouverture de la plateforme aux utilisateurs est prévue fin du premier semestre 2026, avec une transition progressive du mode projet vers un mode Produit incluant les activités RUN, MCO et amélioration continue.
L'équipe Produit cible devra porter un modèle industrialisé basé sur :
- l'observabilité,
- la polyvalence,
- la scalabilité,
- l'automatisation du RUN.
Votre mission
En tant qu'Ingénieur Production & Observabilité IoT, vous jouerez un rôle pivot entre les équipes RUN, BUILD et les expertises techniques transverses.
Votre mission principale sera de garantir :
- la disponibilité,
- la fiabilité,
- l'observabilité bout-en-bout,
- et la compréhension du fonctionnement de la plateforme IoT.
Vous contribuerez également à l'amélioration continue et à l'automatisation des activités d'exploitation.
Missions principales
Diagnostic des incidents & support plateforme
- Être le point d'entrée principal des incidents liés à la plateforme IoT
- Qualifier rapidement les incidents et perturbations
- Réaliser les diagnostics de niveau plateforme
- Résoudre les incidents simples
- Escalader efficacement vers les équipes expertes :
- développement plateforme,
- sécurité,
- infrastructure,
- réseaux,
- cloud/platform engineering
Exploitation & Maintien en Conditions Opérationnelles (MCO)
- Participer au maintien en conditions opérationnelles de la plateforme
- Contribuer à la gestion des environnements :
- développement,
- test,
- production
- Identifier les dérives de :
- performance,
- qualité,
- coûts,
- disponibilité
- Participer aux analyses post-incident (REX)
- Alimenter le backlog d'amélioration continue de la plateforme
Observabilité & amélioration continue
- Maintenir et optimiser les dispositifs de surveillance :
- logs,
- métriques,
- alerting,
- dashboards
- Garantir une vision end-to-end reflétant l'expérience utilisateur
- Identifier les tâches manuelles récurrentes et automatiser les processus RUN
- Participer à la standardisation des pratiques d'exploitation
- Rédiger et maintenir la documentation RUN :
- runbooks,
- procédures,
- consignes d'exploitation
Coordination transverse
- Collaborer quotidiennement avec les équipes de développement plateforme
- Être l'interlocuteur privilégié des équipes d'expertise internes
- Fournir une vision claire et synthétique de l'état de santé de la plateforme aux parties prenantes
Environnement technique
- IoT Platform
- Kubernetes / OpenShift
- Docker
- Jenkins
- Ansible
- MQTT / OPC-UA
- NoSQL
- Observabilité & monitoring
- Automatisation RUN
- Sécurité & certificats
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.