Engineering Manager - AI & Infrastructure H/F/N
Au sein de votre équipe #OneTeam
1. Vous intégrez l’équipe Core IA, qui a à sa charge l’exécution des différentes plateformes que de la conception de nouvelles architectures, l’amélioration de l’automatisation des déploiements / mises à jour / montées de version. L’équipe Core IA crée la magie des solutions d'IA, en tirant le meilleur parti de l'infrastructure OVHcloud et en la mélangeant à une plateforme d'intelligence artificielle de pointe. Du prétraitement à l'inférence, en passant par l’entraînement et les opérations ML, vous serez impliqué dans toute la chaîne de valeur de l'IA.
2. En tant qu'Engineering Manager pour diriger une équipe d'environ 9 experts en IA et Infrastructure. Vous jouerez un rôle crucial dans la définition de la stratégie backend et infrastructure de nos produits d'IA. Votre défi : stimuler l'innovation, assurer l'excellence opérationnelle et aider l'équipe à progresser vers des environnements réglementaires complexes, tels que la conformité SecNumCloud, tout en gérant des services de clusters GPU pour l'entraînement de modèles à grande échelle et en soutenant notre évolution des offres PaaS vers des solutions SaaS complètes.
Vos principales responsabilités
Leadership d'équipe et opérations :
3. Diriger et développer une équipe SRE d'ingénieurs backend et infrastructure (Kubernetes, cloud ops, etc.).
4. Participer aux sprints de livraison (dans une capacité limitée) et prendre part aux rotations d'astreinte.
5. Définir, mettre en œuvre et améliorer continuellement les méthodologies de travail et les cérémonies Agile de l'équipe.
6. Favoriser un fort esprit d'équipe cohésif dans des environnements hybrides et multiculturels.
Orientation stratégique et technique :
7. Servir de liaison entre le département IA et les équipes opérationnelles centrales (NOC, SOC, etc.).
8. Assurer l'alignement entre les décisions techniques et la stratégie globale des produits IA.
9. Garantir la qualité, le coût, le respect des délais et la sécurité des livrables.
10. Piloter la performance à l'aide de KPI techniques et commerciaux clés ; signaler les problèmes et les risques de manière proactive.
Gestion de projets et de ressources :
11. Superviser les ressources humaines et techniques pour atteindre les objectifs de la feuille de route.
12. Gérer les projets techniques en coordination avec les parties prenantes internes.
13. Analyser les échecs techniques et les escalader de manière appropriée.
14. Identifier et promouvoir les opportunités d'amélioration continue et de transformation.
Votre futur impact
Dans 6 mois vous :
15. Vous serez approprié les processus et la méthodologies de l'équipe, veillerez à leur bon respect en vue d'améliorer la qualité et la rapidité des livrables.
16. Aurez développer les relations avec les équipes internes et les parties prenantes sont établies et fonctionnelles, pour faciliter la communication et la collaboration.
17. Représenterez le département AI dans les comités opérationnels, gouvernance et sécurité.
Et dans 1 an
18. Vous aurez mis en place de l'amélioration continue dans les processus de travail et les méthodologies ce qui permettra de réduire davantage les coûts et les délais de livraison.
19. Vous serez reconnue comme une personne clé dans la définition de la stratégie IA de l'entreprise.
20. Vous aurez développer une vision sur les changements nécessaires en termes technologiques et architecturaux pour répondre aux défis du fine-tuning et de la mise à disposition de clusters de calcul.
21. Vous vous serez à l'aise pour gérer tout type d'incident pendant une astreinte.
_
Compétences requises :
22. Expérience solide en gestion de clusters Kubernetes et en opérations d'infrastructure cloud, ainsi qu'en infrastructure as code avec des outils comme Terraform et Ansible.
23. Connaissances approfondies en développement logiciel, avec une préférence pour Golang ou Rust.
24. Compétences avérées en planification, exécution et suivi de projets, en tenant compte des coûts, du temps et de la qualité.
25. Aptitude à définir et analyser des indicateurs de performance pour guider les décisions stratégiques.
26. Excellente communication pour transmettre clairement la stratégie et les priorités.
27. Expérience réussie dans le recrutement, le coaching et le développement de talents techniques.
28. Capacité à comprendre les attentes des clients et à ajuster les priorités des projets en conséquence.
C'est un +
29. Vous avez une expérience avec de la gestion de clusters HPC et GPU.
30. Familiarité avec la conformité et les certifications IT, notamment ISO et HDS.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.