Ingénieur portage modèles nn (h/f)

Meudon

CDI

Le Mercato De L'Emploi

De 50 000 € à 75 000 € par an

Publiée le Il y a 6 h

Description de l'offre

RESPONSABILITÉS : Nous recherchons un Ingénieur Compilateur IA & Activation de Modèles pour assurer la qualification, la validation et l'amélioration continue de la toolchain de compilation de modèles Vsora. Le rôle porte sur la compilation et la validation d'une large gamme de modèles IA de référence et clients, garantissant la correction fonctionnelle, la précision numérique, la robustesse du compilateur et une exécution optimale sur le matériel Vsora. Responsabilités principales : • Compiler des modèles de référence et clients via la toolchain Vsora et vérifier leur déploiement réussi sur le matériel cible. • Identifier, reproduire et déboguer les échecs de compilation, problèmes de conversion de graphes, opérateurs non supportés, divergences numériques et problèmes d'exécution runtime. • Valider la précision numérique en comparant les outputs de modèles compilés aux résultats de frameworks de référence et aux datasets golden. • Mesurer et analyser l'impact sur la précision résultant de la quantification et des optimisations du compilateur, en identifiant les couches, opérateurs ou architectures particulièrement sensibles à la précision réduite. • Travailler en étroite collaboration avec les développeurs de l'équipe IA pour isoler les causes racines, prioriser les correctifs, valider les améliorations et élargir la couverture de modèles. • Développer des frameworks de régression automatisés pour la validation continue de la fonctionnalité du compilateur, de la compatibilité des modèles, de la précision et des performances. PROFIL RECHERCHÉ : • Solides compétences en programmation Python et/ou C++. • Solide expérience avec les frameworks ML : PyTorch, TensorFlow, ONNX, JAX ou écosystèmes équivalents. • Expérience avec les compilateurs IA, frameworks d'optimisation de graphes, pipelines de conversion de modèles ou toolchains de déploiement. • Familiarité avec des technologies telles que ONNX Runtime, TensorRT, OpenVINO ou infrastructures de compilation similaires. • Solide compréhension des architectures de réseaux de neurones, graphes de calcul, implémentations d'opérateurs et exécution d'inférence. • La familiarité avec les accélérateurs IA, NPU, GPU ou architectures matérielles personnalisées est fortement souhaitée.

Postuler

Créer une alerte

Sauvegarder

Offre similaire

Administrateur systèmes et réseaux (h/f) (cdi)

Paris

CDI

Le Mercato De L'Emploi

Administrateur systèmes et réseaux

Offre similaire

Médecin pneumologue h/f (cdi)

Nanterre

CDI

Le Mercato De L'Emploi

Pneumologue

Offre similaire

Médecin coordonnateur / prescripteur h/f (cdi)

Paris

CDI

Le Mercato De L'Emploi

Médecin

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.