Emploi
Assistant de carrière BÊTA J'estime mon salaire
Mon CV
Mes offres
Mes alertes
Se connecter
Trouver un emploi
TYPE DE CONTRAT
Emploi CDI/CDD
Missions d'intérim Offres d'alternance
Astuces emploi Fiches entreprises Fiches métiers
Rechercher

Ingénieur logiciel – runtime d'inférence ia & plateforme de serving h/f

Nanterre
Le Mercato De L'Emploi
Ingénieur logiciel
Publiée le 15 juin
Description de l'offre

VSORA est une société française de semi-conducteurs fabless spécialisée dans la conception de processeurs d'inférence IA haute performance pour le cloud et les centres de données. Son processeur phare, le Jotunn8, a été conçu pour répondre aux défis énergétiques et de performance des charges de travail IA modernes : débit élevé, latence ultra-faible et efficacité énergétique optimale. Il fait partie des processeurs les plus puissants du marché, utilisé notamment pour le traitement des grands modèles de langage (LLM). Portée par une équipe dirigeante avec plus de 25 ans d'expérience en conception de puces, VSORA s'inscrit dans la prochaine vague du calcul IA durable et scalable. L'entreprise mise sur une culture collaborative, agile et bienveillante, où hiérarchies rigides et silos n'ont pas leur place. Rejoindre VSORA, c'est intégrer une équipe multiculturelle et talentueuse, contribuer à une mission ambitieuse et avoir un impact réel sur la construction d'une société de référence dans son secteur. www.Vsora.Com Nous recherchons un Ingénieur Logiciel pour permettre le serving d'inférence IA à grande échelle sur la plateforme accélératrice Vsora Jotunn8. Le rôle porte sur l'évaluation, le portage, l'optimisation et le déploiement de runtimes d'inférence et frameworks de serving de pointe tels que vLLM et SGLang, afin de délivrer des solutions de serving IA performantes et scalables. Responsabilités principales
- Piloter la conception, le développement et l'intégration de la stack logicielle chargée d'orchestrer et de gérer les charges de travail d'inférence IA hautes performances sur l'accélérateur Vsora Jotunn8.
- Évaluer et conduire une analyse technique approfondie des runtimes d'inférence IA modernes et des frameworks de serving, notamment vLLM, SGLang et d'autres solutions émergentes pour LLMs et charges de travail IA.
- Piloter le portage et l'optimisation des runtimes d'inférence et frameworks de serving sélectionnés vers la plateforme matérielle Vsora, en exploitant pleinement les capacités de l'accélérateur.
- Concevoir et implémenter des architectures de déploiement scalables pour le serving IA, couvrant les environnements mono-nœud et distribués, la planification des modèles, la gestion des ressources et les opérations en production.
- Définir l'architecture logicielle et la roadmap pour le serving IA sur les plateformes Vsora, en équilibrant performance, couverture fonctionnelle, maintenabilité et compatibilité écosystème.
- Collaborer avec les communautés open-source et les partenaires de l'écosystème IA pour assurer la compatibilité avec les principaux frameworks, environnements de déploiement et écosystèmes de modèles.
- Accompagner les clients et équipes internes via des implémentations de référence, des guides de déploiement, des caractérisations de performance et des bonnes pratiques pour l'inférence IA sur les plateformes Vsora.
- Solides compétences en programmation Python et/ou C++.
- Solide expérience avec les frameworks ML : PyTorch, TensorFlow, JAX, ONNX ou écosystèmes équivalents.
- Expérience dans le déploiement, l'optimisation ou le portage de modèles IA sur des plateformes matérielles spécialisées (GPU, NPU, accélérateurs IA).
- Compréhension des architectures de réseaux de neurones : transformers, modèles de diffusion, CNN, modèles multimodaux et grands modèles de langage.
- Familiarité avec les compilateurs ML, frameworks d'optimisation de graphes et toolchains de déploiement (ONNX Runtime).
- La connaissance de la quantification, précision mixte, compression de modèles et techniques d'optimisation d'inférence est un plus.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder
Offre similaire
Ingénieur logiciel – runtime d'inférence ia & plateforme de serving h/f (cdi)
Nanterre
CDI
Le Mercato De L'Emploi
Ingénieur logiciel
Offre similaire
Ingenieur logiciel h/f
Éragny
CDI
Ingénieur logiciel
De 42 000 € à 50 000 € par an
Offre similaire
Apprenti(e) ingénieur logiciel : spécialiste en simulation numérique de systèmes d'armes f/h
Saint-Denis
MBDA
Ingénieur logiciel
Voir plus d'offres d'emploi
Estimer mon salaire
JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.

Offres similaires
Emploi Informatique à Nanterre
Emploi Nanterre
Emploi Hauts-de-Seine
Emploi Ile-de-France
Intérim Informatique à Nanterre
Intérim Nanterre
Intérim Hauts-de-Seine
Intérim Ile-de-France
Accueil > Emploi > Emploi Informatique > Emploi Ingénieur logiciel > Emploi Ingénieur logiciel à Nanterre > Ingénieur Logiciel – Runtime D'Inférence Ia & Plateforme De Serving H/F

Jobijoba

  • Conseils emploi
  • Avis Entreprise

Trouvez des offres

  • Emplois par métier
  • Emplois par secteur
  • Emplois par société
  • Emplois par localité
  • Emplois par mots clés
  • Missions Intérim
  • Emploi Alternance

Contact / Partenariats

  • Contactez-nous
  • Publiez vos offres sur Jobijoba
  • Programme d'affiliation

Suivez Jobijoba sur  Linkedin

Mentions légales - Conditions générales d'utilisation - Politique de confidentialité - Gérer mes cookies - Accessibilité : Non conforme

© 2026 Jobijoba - Tous Droits Réservés

Les informations recueillies dans ce formulaire font l’objet d’un traitement informatique destiné à Jobijoba SA. Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous disposez d’un droit d’accès et de rectification aux informations qui vous concernent. Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant. Pour en savoir plus, consultez vos droits sur le site de la CNIL.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder