Description du poste
Équipes ML Platform et ML Lab
* L'équipe ML Platform est centrée sur l'amélioration de la productivité des chercheurs dans l'entraînement de modèles de machine learning (ML) en développant des bibliothèques, des services et des bonnes pratiques, et en assurant une production ML robuste à grande échelle. L'équipe est composée de profils travaillant sur des projets transverses ainsi que d'ingénieurs accompagnant les équipes fonctionnelles dans leur parcours ML.
* Le ML Lab est une équipe de recherche axée sur des travaux académiques, nécessitant donc des outils et une infrastructure dédiés en dehors de l'infrastructure du client, afin de pouvoir accéder librement aux ressources open source de pointe et collaborer avec des collaborateurs externes.
Mission
* En tant qu'Ingénieur DevOps au sein de l'équipe ML Platform, vous tirerez parti de votre solide bagage en ingénierie logicielle, de votre maîtrise de Python et de votre expérience pratique avec les fournisseurs cloud pour faciliter le travail quotidien de l'équipe ML Lab sur — leur néocloud de référence — ainsi que les liens nécessaires avec l'infrastructure du client, principalement hébergée sur AWS.
Responsabilités principales
* Configuration du fournisseur cloud (Lambda) pour l'accès GPU par le ML Lab.
* Fonctionnalités FinOps et protection minimale contre les erreurs humaines.
* Optimisation des images Docker pour un démarrage à froid plus rapide.
* Mise en place et maintenance de systèmes de monitoring pour l'entraînement des modèles.
* Participation mineure aux projets plus larges de l'équipe ML Platform sur AWS pour les autres chercheurs du client (CI/CD, outillage sur AWS, etc.).
* Promotion et mise en œuvre de processus d'automatisation.
* Renforcement des protocoles de sécurité via des évaluations de vulnérabilités et la gestion des risques pour déployer des mesures de cybersécurité.
Profil recherché
Vos compétences
Obligatoires — Techniques : Anglais obligatoire
* Expertise de Terraform et AWS.
* Solide expérience en CI/CD, idéalement avec GitLab CI et Jenkins.
* Expérience étendue dans l'utilisation de Docker et la gestion d'images Docker à grande échelle au sein d'une organisation.
* Compétence dans la mise en place et la maintenance de systèmes de monitoring.
* Bonne connaissance des systèmes UNIX.
Obligatoires — Soft skills :
* Capacité à formuler et défendre des opinions fortes de manière constructive, en favorisant le consensus.
* Expérience pour comprendre que toutes les décisions ne iront pas dans votre sens, avec la capacité de ne pas être d'accord tout en s'engageant.
* Approche centrée sur l'utilisateur en évitant les solutions court-termistes.
* Aptitude à engager et motiver les collègues à adopter les bonnes pratiques.
* Engagement envers la productivité et la résilience de l'équipe par le partage des compétences, au-delà de la contribution individuelle.
Nice to have — Techniques
* Expérience adjacente aux sujets liés au ML.
* Avoir travaillé avec Lambda.
* Avoir travaillé dans un environnement on-premise, Slurm apprécié.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.