Contexte de la mission
Alliance Services Plus (AS+) recherche un(e) Consultant(e) HPC Senior pour intervenir dans le cadre d’un projet stratégique de conception et de déploiement d’une solution HPC accélérée GPU, au sein d’un environnement industriel à forts enjeux technologiques.
Le/la consultant(e) interviendra sur les phases de design, implémentation, migration applicative et benchmarking, en lien étroit avec les équipes d’architecture infrastructure, les équipes de développement applicatif du client et les partenaires technologiques.
Missions principales
Le/la consultant(e) interviendra sur plusieurs volets techniques complémentaires :
A) Architecture et implémentation HPC
* Conception et mise en œuvre d’architectures HPC GPU scalables (calcul et réseau)
* Design et déploiement de clusters GPU à grande échelle
* Installation et configuration des nœuds de gestion, de visualisation, d’accès interactif et de calcul
* Réalisation des tests d’acceptation des solutions
B) Réseaux et technologies NVIDIA
* Déploiement et support des technologies réseau NVIDIA :
o InfiniBand
o Spectrum-X
o MLNX-OS, Cumulus, SONIC
* Administration et orchestration via des outils tels que NVIDIA Base Command Manager (ou équivalent)
C) Migration applicative et performance
* Accompagnement à la migration des applications HPC vers la nouvelle infrastructure
* Optimisation des performances applicatives afin d’exploiter pleinement les capacités GPU
* Mise en œuvre, exécution et analyse de benchmarks de performance
* Ajustements et optimisations en fonction des résultats obtenus
D) Interface technique et accompagnement
* Rôle d’interface technique entre les équipes d’architecture, les équipes de développement applicatif du client et les partenaires technologiques (dont NVIDIA)
* Production de documentation technique : architectures, guides de déploiement, procédures opérationnelles
* Support opérationnel, troubleshooting et montée en compétence des équipes clientes
Environnement technique
* Environnements HPC accélérés GPU NVIDIA
* Clusters GPU à grande échelle
* Réseaux haute performance (InfiniBand et technologies NVIDIA)
* Outils d’orchestration et de gestion HPC
* Interaction étroite avec équipes infrastructure et développement applicatif
Profil recherché
Compétences essentielles :
* Expertise confirmée en High Performance Computing (HPC)
* Solide expérience dans la conception et le déploiement de clusters GPU NVIDIA
* Maîtrise des technologies réseau NVIDIA et des architectures à grande échelle
* Administration Linux et compétences en scripting
* Expérience avec Base Command Manager ou outils similaires
* Excellentes capacités de communication, de conseil et de rédaction technique
* Capacité à piloter plusieurs sujets techniques en autonomie et à interfacer avec des équipes de développement
Compétences appréciées :
* Certifications techniques : CCNP, LFCS, NCP-AIN, NCP-AIO
* Expérience avec NVIDIA DGX, Kubernetes, Docker, Slurm
* Connaissance des environnements datacenter, de l’intégration cloud ou des frameworks GenAI
Depuis 2010, Alliance Services Plus (AS+) s'adresse à tous les acteurs du Calcul Intensif, de la Data Analytics et de l'IA : Utilisateurs industriels et académiques, opérateurs et hébergeurs de centres de calcul, éditeurs et développeurs de solutions digitales.
Notre offre de services couvre les trois grands domaines de compétences suivants :
1- Le développement et la simulation numérique en environnement HPC/HPDA - Développement & portage de codes sur architectures parallèles
- Tierce maintenance applicative (TMA) de codes de calcul
- Audit et optimisation de performances
2- Le support aux infrastructures HPC/HPDA sur site, cloud ou hybrides :
- Support applicatif HPC
- Infogérance de systèmes HPC (MCO/MCS)
3- L'accompagnement des projets HPC/HPDA :
- Audit et choix d'architectures (systèmes, stockage, réseaux, ...)
- Outils et méthodes - Formations
Ce que nous offrons
• Mission au cœur d'un environnement industriel de pointe
• Diversité des domaines scientifiques et des problématiques
• Travail en équipe avec des ingénieurs calcul expérimentés
• Formation continue sur les outils et méthodes de simulation
• Intégration à une équipe AS+ reconnue pour son expertise HPC
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.