Contexte de la mission Dans le cadre de la mise en place du standard Groupe autour des plateformes IoT, nous recherchons un Ingénieur Production & Observabilité IoT afin d'accompagner le déploiement et l'exploitation de la future plateforme basée sur la solution ThingsBoard. Cette plateforme a pour objectif de fournir une première instance opérationnelle, industrialisée et interconnectée, conforme aux standards IoT du Groupe et aux exigences métiers en matière de disponibilité, sécurité et qualité de service. L'ouverture de la plateforme aux utilisateurs est prévue fin du premier semestre 2026, avec une transition progressive du mode projet vers un mode Produit incluant les activités RUN, MCO et amélioration continue. L'équipe Produit cible devra porter un modèle industrialisé basé sur : - l'observabilité, - la polyvalence, - la scalabilité, - l'automatisation du RUN. Votre mission En tant qu'Ingénieur Production & Observabilité IoT, vous jouerez un rôle pivot entre les équipes RUN, BUILD et les expertises techniques transverses. Votre mission principale sera de garantir : - la disponibilité, - la fiabilité, - l'observabilité bout-en-bout, - et la compréhension du fonctionnement de la plateforme IoT. Vous contribuerez également à l'amélioration continue et à l'automatisation des activités d'exploitation. Missions principales Diagnostic des incidents & support plateforme - Être le point d'entrée principal des incidents liés à la plateforme IoT - Qualifier rapidement les incidents et perturbations - Réaliser les diagnostics de niveau plateforme - Résoudre les incidents simples - Escalader efficacement vers les équipes expertes :développement plateforme, - sécurité, - infrastructure, - réseaux, - cloud/platform engineering Exploitation & Maintien en Conditions Opérationnelles (MCO) - Participer au maintien en conditions opérationnelles de la plateforme - Contribuer à la gestion des environnements :développement, - test, - production Identifier les dérives de : - performance, - qualité, - coûts, - disponibilité Participer aux analyses post-incident (REX)Alimenter le backlog d'amélioration continue de la plateformeObservabilité & amélioration continue - Maintenir et optimiser les dispositifs de surveillance :logs, - métriques, - alerting, - dashboards Garantir une vision end-to-end reflétant l'expérience utilisateurIdentifier les tâches manuelles récurrentes et automatiser les processus RUNParticiper à la standardisation des pratiques d'exploitationRédiger et maintenir la documentation RUN : - runbooks, - procédures, - consignes d'exploitation Coordination transverse - Collaborer quotidiennement avec les équipes de développement plateforme - Être l'interlocuteur privilégié des équipes d'expertise internes - Fournir une vision claire et synthétique de l'état de santé de la plateforme aux parties prenantes Environnement technique - IoT Platform - Kubernetes / OpenShift - Docker - Jenkins - Ansible - MQTT / OPC-UA - NoSQL - Observabilité & monitoring - Automatisation RUN - Sécurité & certificats
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.