Nous recrutons un·e Architecte système et réseau afin de renforcer notre équipe AI Factory. OUTSCALE, marque de Dassault Systèmes, est un opérateur souverain et durable de l’Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance. Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Expériences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l’obtention de la qualification SecNumCloud. Le poste à pourvoir s’inscrit dans un environnement international, hautement distribué et orienté performance extrême, faible latence et scalabilité horizontale. Vos missions Dans le cadre du déploiement et de l’exploitation d’une AI Factory à très grande échelle, reposant sur plusieurs clusters NVIDIA NVL72, vous êtes en charge de l’architecture, l’optimisation et de l’évolution des infrastructures réseaux, systèmes et GPU fabrics alimentant des charges IA critiques. Architecture & design de la GPU Fabric : Concevoir et faire évoluer des architectures réseau haut débit, faible latence, adaptées aux NVL72 et aux workloads IA massivement parallèles Définir les topologies réseau pour : Interconnexion intra-NVL72 Scale-out multi-racks / multi-clusters Sélectionner et valider les technologies : InfiniBand HDR / NDR Ethernet Spectrum / RoCEv2 Dimensionner les fabrics pour des usages IA à très grande échelle Performance, RDMA & communications GPU : Piloter le développement, l’optimisation et le tuning des communications RDMA Optimisations GPUDirect / GPUDirect-RDMA Garantir des transferts à très haute performance, sans surcharge CPU Optimiser les communications collectives : NCCL MPI / CUDA-aware MPI Identifier et lever les goulots d’étranglement réseau, mémoire et CPU/GPU Intégration Kubernetes & workloads IA : Concevoir l’intégration réseau de clusters GPU dans des environnements Kubernetes Gérer l’exposition et l’isolation des interfaces RDMA Garantir le bon fonctionnement des workloads conteneurisés IA Exploitation, observabilité & troubleshooting Mettre en place et exploiter des solutions de monitoring Latence, bande passante, congestion, erreurs Prometheus, Grafana Analyser les performances réseau et GPU fabric en production Proposer et implémenter : ajustements MTU, affinités CPU/GPU et tuning NIC, switch et firmware Assurer le support niveau 2 / 3 sur incidents critiques Documentation Rédaction de procédures, schémas d’infrastructure Mise à jour du wiki Confluence et du CMDB Veille technologique Suivi des évolutions NVIDIA, Mellanox, standards RDMA, Kubernetes Proof‑of‑concept sur les nouvelles générations de NIC Stack technique Solide expérience en architecture réseau HPC/IA /GPU Maîtrise avancée de : InfiniBand & RoCEv2 RDMA, GPUDirect, NCCL Architectures GPU Bonne connaissance de : Linux Capacité à diagnostiquer des problèmes complexes de performance distribuée Votre profil Diplômé·e d'un Master en ingénierie informatique, vous possédez une expérience professionnelle post-diplôme minimum de 4 ans dans des environnements HPC ou IA. Vous parlez anglais et français couramment. Vous appréciez analyser & résoudre des problèmes complexes Vous aimez travailler en équipe. Nous rejoindre c'est aussi Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans Principaux avantages et bénéfices : Environnement multiculturel Cadre de travail convivial axé sur le bien-être et la santé Engagement en faveur de la diversité et de l’inclusion Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc. Vous souhaitez en savoir plus ? N'hésitez pas à nous suivre sur Linkedin et découvrez nos dernières offres et actus. Déclaration de diversité La diversité d’OUTSCALE trouve aussi son expression dans notre politique de recrutement qui privilégie l’égalité des chances, la diversité des individus au sein de nos équipes. Dassault Systèmes, avant-gardiste en matière de technologie et d’innovation durable, s’efforce de créer des équipes toujours plus inclusives et diverses à travers le monde. Nous avons la forte conviction que nos employés sont notre atout numéro 1 et nous voulons que tous, se sentent libres d’être pleinement qui ils sont vraiment. Notre objectif est qu’ils ressentent fierté et sentiment d’appartenance. En tant qu’entreprise à la pointe du changement, il nous incombe de favoriser l’inclusion de tous et participer à création du monde de demain. Vous souhaitez en savoir plus ? N'hésitez pas à nous suivre sur Linkedin et découvrez nos dernières offres et actus. OUTSCALE, marque de Dassault Systèmes, est un opérateur souverain et durable de l'Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance. Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Expériences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l'obtention de la qualification SecNumCloud. Notre mission ? Bâtir un monde numérique accessible et meilleur pour tous à travers la création du jumeau virtuel de l organisation. Nous menons une politique RH engagée et inclusive favorisant le bien-être de nos collaborateur·rices : respect de l'équilibre vie privée/vie professionnelle, développement personnel et des compétences professionnelles, onboarding complet Nous rejoindre, c'est partager une passion pour l'innovation, des valeurs communes et imaginer ensemble des solutions de confiance pour construire un monde meilleur et durable !
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.