Contexte de la Mission Alliance Services Plus (AS) recherche un(e) Ingénieur(e) Système HPC senior pour assurer l’infogérance de l’infrastructure de calcul haute performance d’une autorité publique indépendante française du secteur nucléaire, dans le cadre d’un marché public stratégique. Notre client est chargé de missions critiques en matière de sûreté nucléaire et de radioprotection, incluant la recherche, l'expertise technique, la réglementation et le contrôle des activités nucléaires civiles en France. La mission se déroule dans un environnement hautement régulé et sensible pour la sûreté nationale, exigeant un très haut niveau d’expertise technique, une rigueur absolue et le respect strict des normes de sécurité. ⚠️ Exigences Critiques Habilitation de sécurité obligatoire Citoyenneté française ou UE obligatoire Disponibilité 24/7 pour une infrastructure critique Conformité stricte aux normes de sécurité et réglementations nucléaires Missions Principales 1. Phase de Prise en Charge Audit complet de l’infrastructure HPC existante (architecture, performances, sécurité, conformité réglementaire) Production d’une documentation exhaustive conforme aux standards nucléaires Mise en place des processus d’infogérance haute disponibilité Déploiement des outils de supervision et de traçabilité Transition sécurisée et transfert de compétences avec les équipes sortantes 2. Phase de Production – Administration Système Administration des clusters HPC dédiés aux calculs de sûreté nucléaire et de radioprotection Gestion des ordonnanceurs de jobs en environnement critique (Slurm, PBS Pro) Supervision et monitoring 24/7 avec alerting temps réel (Nagios, Prometheus, Grafana) Gestion des incidents critiques selon les processus ITIL et procédures d’urgence Maintenance préventive et corrective avec fenêtres d’intervention planifiées Gestion sécurisée des mises à jour système (validation, tests, procédures de rollback) Optimisation des performances pour codes de calcul scientifiques (modélisation et simulations de sûreté) Traçabilité complète des actions et reporting de conformité réglementaire 3. Phase de Production – Expertise Technique Support aux chercheurs et experts sur les applications scientifiques HPC Installation, configuration et optimisation de codes de calcul complexes Expertise en parallélisation (MPI, OpenMP) Optimisation GPU pour simulations intensives Conteneurisation sécurisée des applications scientifiques (Singularity) Veille technologique HPC et recommandations d’évolution compatibles avec les exigences de sûreté Activités Complémentaires – Projets Stratégiques Participation aux projets de modernisation et d’extension des infrastructures HPC Intégration de nouvelles architectures matérielles (CPU, GPU, accélérateurs) Migration et transformation des infrastructures en garantissant la continuité de service Support aux opérations d’intégration de codes de calcul scientifiques très complexes Compétences Techniques Recherchés Administration Linux en environnement HPC de production (RHEL, CentOS, Rocky Linux, Ubuntu Server) Gestion de clusters HPC : architecture, stockage parallèle, réseaux haute performance Ordonnanceurs de jobs : Slurm (obligatoire), PBS Pro, Torque Systèmes de fichiers parallèles : Lustre (prioritaire), GPFS / Spectrum Scale, BeeGFS Réseaux HPC : InfiniBand, RoCE (configuration, optimisation, troubleshooting) Automatisation et scripting avancé : Bash, Python Supervision & monitoring : Nagios, Prometheus, Grafana, Zabbix, collectd Gestion de configuration : Ansible (obligatoire), Puppet, Chef, Salt Sécurité système : hardening, audits, conformité réglementaire, gestion d’incidents Compétences Techniques Appréciées Calcul GPU : NVIDIA CUDA, AMD ROCm (optimisation de codes, etc) Bibliothèques et outils HPC : OpenMPI, MPICH, Intel MKL, BLAS/LAPACK Conteneurisation HPC : Singularity / Apptainer (prioritaire), Docker Gestion des environnements logiciels : Lmod, environment-modules Debugging & profiling : gdb, valgrind, outils HPC (Intel VTune, ARM MAP) Codes de calcul scientifiques : CFD, simulation physique, modélisation Virtualisation & cloud HPC : OpenStack, Kubernetes (K8s pour HPC) Formation & Expérience Diplôme : Bac5 (Master ou Ingénieur) en informatique, calcul scientifique ou équivalent Expérience : Profil expérimenté avec un minimum 5 années en administration système HPC ou infrastructures critiques Atout majeur : expérience en environnement hautement régulé (nucléaire, défense, santé, recherche publique) Qualités Professionnelles Rigueur et sens des responsabilités en environnement critique Capable de gérer et prendre des décisions en cas d'urgence Autonomie, proactivité et esprit d’équipe Excellente communication, maîtrise du français (obligatoire) et de l’anglais technique, dans le respect strict des procédures de sécurité Depuis 2010, Alliance Services Plus (AS) s'adresse à tous les acteurs du Calcul Intensif, de la Data Analytics et de l'IA : Utilisateurs industriels et académiques, opérateurs et hébergeurs de centres de calcul, éditeurs et développeurs de solutions digitales. Notre offre de services couvre les trois grands domaines de compétences suivants : 1- Le développement et la simulation numérique en environnement HPC/HPDA - Développement & portage de codes sur architectures parallèles - Tierce maintenance applicative (TMA) de codes de calcul - Audit et optimisation de performances 2- Le support aux infrastructures HPC/HPDA sur site, cloud ou hybrides : - Support applicatif HPC - Infogérance de systèmes HPC (MCO/MCS) 3- L'accompagnement des projets HPC/HPDA : - Audit et choix d'architectures (systèmes, stockage, réseaux, ) - Outils et méthodes - Formations Ce que nous offrons • Mission au cœur d'un environnement industriel de pointe • Diversité des domaines scientifiques et des problématiques • Travail en équipe avec des ingénieurs calcul expérimentés • Formation continue sur les outils et méthodes de simulation • Intégration à une équipe AS reconnue pour son expertise HPC
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.