Description du poste
CDI (statut cadre) à Paris IDF. 2/3 jours de télétravail
5 à 10 ans d'expérience en tant qu’Architecte Technique
Rémunération selon votre expérience et vos compétences : 60/65 K€
Au sein du groupe SCALIAN, la division Scalian Consulting constitue une nouvelle organisation de 350 consultants réunissant les activités de :
* Noveane, cabinet de conseil spécialisé dans l’alignement stratégique, le pilotage et la mise en œuvre des transformations digitales notamment dans le secteur public (Etat et territoires), la protection sociale, les banques et assurances.
* OneFirst, cabinet de conseil en management des systèmes d'information et transformation numérique opérant principalement dans les secteurs de la mode, du luxe et du retail.
Vous êtes Architecte Technique H/F !
Vous rejoindrez notre équipe Services publics, Protection sociale & Santé, qui intervient en accompagnement des administrations et établissements publics pour mettre l’intérêt général au cœur des transformations numériques. Notre offre autour de l’agilité vise à accompagner les métiers et la technique pour concrétiser ambitions et politiques publiques dans un produit numérique.
Nous recherchons un Architecte Technique capable d’apporter une vision robuste, pragmatique et opérationnelle sur l’industrialisation des modèles IA.
Vos principales missions
* Déployer, optimiser et maintenir les modèles IA en environnements dev et prod (LLMs, modèles légers, multimodaux).
* Mettre en place des optimisations de performance : paramétrage vLLM / LiteLLM, quantification, pruning, cache, speculative decoding, multi-instances, contextes élargis, etc.
* Assurer la scalabilité des environnements et la robustesse des pipelines IA.
* Effectuer des tirs de charge et tests de performance, assurer la supervision du cycle de vie complet des modèles (téléchargement, tests, décommissionnement).
* Collaborer étroitement avec les data scientists, les équipes produit et les partenaires techniques (ex. Nvidia).
* Participer à la structuration de la gouvernance technique et à la définition des bonnes pratiques d’industrialisation IA.
Qualifications
* Solide expérience d’architecte technique (5–10 ans min), idéalement dans des environnements bancaires ou secteur public.
* Maîtrise des concepts de LLMOPS et des optimisations de modèles IA (vLLM, LiteLLM…).
* Connaissance approfondie des techniques d’optimisation : quantification, pruning, cache management, speculative decoding, etc.
* Bonne compréhension des environnements hybrides cloud / on-premise.
* Expérience démontrée en déploiement et monitoring de modèles IA.
* Esprit analytique, autonomie forte et capacité à travailler dans un environnement en évolution rapide.
* Très bon communicant, apte à collaborer avec des équipes multidisciplinaires.
* Excellente maîtrise du français, à l’oral comme à l’écrit.
Informations supplémentaires
Ce que nous valorisons
* Une culture technique large : architectures distribuées, performance, CI/CD, containers.
* Un vernis IA / data permettant de comprendre les enjeux des data scientists.
* Une appétence pour les environnements régulés (banque, secteur public).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.