Intégré au centre de service pour un équipementier aéronautique, vous intervenez en tant qu'administrateur exploitant dans un environnement IA et MLOps, avec une forte composante infrastructure et déploiement de modèles. Vous travaillez sous la supervision d'un responsable d'exploitation, au sein d'une équipe d'administrateur système, en assurant la stabilité, la disponibilité et la maintenance opérationnelle des solutions IA.
Vous vous assurerez que les services livrés ont les meilleurs niveaux de disponibilité et de qualité possibles. Vous interviendrez de manière proactive et curative sur les services en production. Votre objectif principal est de maintenir les services à un niveau de fonctionnement nominal en évitant ou en minimisant les effets sur le service client.
Vous intervenez dans les locaux du client à Magny-Les-Hameaux (78).
Votre mission:
Maintenir en condition opérationnelle les environnements IA, ML/DL, et leur infrastructure (Docker, Kubernetes, OpenShift facultatif).
Surveiller la performance, la disponibilité et la sécurité des plateformes.
Déployer, upgrader et gérer les pipelines CI/CD pour les modèles IA avec Run AI, Mistral AI ou outils équivalents.
Gérer les ressources GPU, CPU, stockage et réseau pour les déploiements.
Traiter les incidents, effectuer la résolution de problèmes et assurer la continuité de service.
Documenter les procédures, configurations et incidents.
Participer à la gestion des changements et à la sécurité opérationnelle.
De formation supérieure Bac+2/3, certifié ITIL Fundation v3/v4, vous disposez d'une expérience significative (2 à 4 ans) dans le domaine IT Cloud.
Maîtrise des outils de containerisation (Docker, Kubernetes).
Connaissance des plateformes MLOps (Run AI, Mistral AI).
Gestion des ressources GPU (Run AI, autres outils).
Scripting Bash, Python.
Surveillance et monitoring (Prometheus, Grafana, Zabbix, autres).
Notions d'infrastructure cloud (Azure, AWS, GCP) et on-premise.
Compétences complémentaires appréciées : Redhat OpenShift. Automatisation avec Ansible, Terraform. Gestion des sauvegardes et reprise d'activité.
Fort d'une expérience réussie au sein d'un environnement opérationnel, vous souhaitez enrichir votre parcours dans l'IT en l'exerçant sur la construction et la gestion d'une importante infrastructure de production informatique en France.
Vous possédez un esprit d'analyse et de synthèse, appréciez travailler dans un milieu opérationnel et technique et en travailler en équipe. Vous savez vous adapter à vos interlocuteurs et faire preuve d'une bonne capacité d'écoute. Vous êtes rigoureux, méthodique, force de proposition et faites preuve d'initiative.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.