L’objectif est de mettre en place un socle technique IA en local, basé sur des technologies Open Source, permettant de répondre à plusieurs cas d’usage.
Développement et maintenance de l’infrastructure back-end
Concevoir, développer et maintenir l’architecture serveur pour supporter les fonctionnalités d’IA
Assurer la gestion des bases de données, des API et des serveurs
Optimiser les performances pour les charges liées aux modèles d’IA
Collecter, organiser et préparer les données pour l’entraînement et le déploiement des modèles
Mettre en place des pipelines de données automatisés (ETL)
Intégrer des bases de données relationnelles et NoSQL
Mettre en place des traitements asynchrones
Collaborer avec les équipes pour intégrer des modèles ML / Deep Learning
Surveiller la performance des modèles en production
Intégrer des modèles IA / LLM dans des applications existantes
Gérer les coûts liés aux ressources (GPU / CPU, cloud)
Optimiser les algorithmes et limiter la latence
Mettre en place des solutions de mise en cache et de compression
Assurer le monitoring, les logs et la gestion de la performance
Traduire les besoins métiers en solutions techniques adaptées
Conception technique détaillée
Code back-end
Intégration d’APIs / services REST
Tests unitaires, automatisés et fonctionnels
Spécifications technico-fonctionnelles
Documentation technique et utilisateur
Présentations et supports d’ateliers
Matrice des risques
Planning détaillé avec les différents jalons
Environnement technique
Développement & APIs
Python / FastAPI
API REST
IA générative & traitement documentaire
RAG
Embeddings
Vector stores
Prompting
Hugging Face / intégration via API de modèles
VLLM
LLAMA CPP
LangChain
LangGraph
Infrastructure & industrialisation
Docker
Déploiement et industrialisation
Données
SQL
NoSQL
Data & Machine Learning
Algorithmes
Machine Learning
Outils
GitLab
Jira Atlassian
Office 365 (Word, Excel, PowerPoint, Forms)
Compétences attendues
Conception et développement d’architectures back-end orientées IA
Développement et sécurisation d’API REST
Mise en place de pipelines ETL / data pipelines et traitements asynchrones
Intégration de modèles IA / LLM dans des applications existantes
Gestion des paramètres : cache, fine tuning, prompt engineering
Utilisation et implémentation de modèles d’inférence locaux
Monitoring, logs, performance et gestion de la latence
Maîtrise des outils de tests automatisés
Connaissance des systèmes de gestion de bases de données et sensibilisation au DevOps (hébergement, routage, réseautage, déploiement cloud)
Soft skills
Coopération / transversalité / travail en réseau
Capacité de synthèse de l’information
Bonne capacité rédactionnelle
Rigueur
Sens de l’organisation
Localisation : Paris
Démarrage : ASAP
Expérience requise : 4 à 6 ans
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.