Description du poste
Contexte
Dans le cadre du développement de solutions d’intelligence artificielle, l’équipe souhaite renforcer ses capacités sur des projets basés sur les LLM (Large Language Models).
Les travaux portent sur la mise en place d’applications exploitant des données internes, avec des enjeux de performance, de coût et de qualité des réponses.
L’environnement est orienté innovation avec :
* intégration de modèles de type Transformer
* mise en œuvre de solutions RAG
* exploitation de bases vectorielles
* développement d’API pour exposition des services IA
* industrialisation et monitoring des usages
Le poste s’inscrit dans un contexte de production avec des contraintes fortes de scalabilité, latence et fiabilité.
Missions principales
* Développer des applications IA basées sur Python
* Concevoir des architectures utilisant des modèles de type Transformer
* Implémenter des solutions RAG
* Intégrer et exploiter des modèles pré-entraînés (fine-tuning)
* Optimiser les performances (temps de réponse, mémoire)
* Mettre en place des API (synchrones / asynchrones)
* Assurer la qualité du code (tests, linting, bonnes pratiques)
* Mettre en place l’observabilité des systèmes IA (LangSmith)
* Gérer les données et pipelines ML (DVC, bases vectorielles
Profil recherché
Compétences techniques
Langages & Développement
* Python avancé (POO, générateurs, gestion mémoire)
* Bonne compréhension des différences Python / Java / C
* Maîtrise du GIL et des limites de performance
Qualité & Bonnes pratiques
* Utilisation de linters (Flake8, Pylint)
* Respect des standards (PEP8)
* Gestion des copies (shallow vs deep copy)
IA & Machine Learning
* Compréhension des Transformers et mécanisme d’attention
* Connaissance des modèles NLP (BERT, GPT, Mistral)
* Fine-tuning de modèles
* Evaluation de modèles (ROUGE, BLEU, G-Eval)
Architecture IA
* Mise en œuvre de RAG
* Gestion de la fenêtre de contexte et température
* Différences RNN / LSTM / Transformers
Données & Stockage
* SQL (dont Materialized Views)
* Bases vectorielles (Pinecone, Chroma, Milvus)
* Feature Engineering
Outils & Frameworks
* LangChain / LangGraph
* LangSmith (observabilité)
* DVC (versioning de données)
* Frameworks Python fullstack (ex : Reflex)
3. Compétences fonctionnelles
* Capacité à concevoir une architecture IA complète
* Analyse de performance et optimisation
* Capacité à industrialiser des solutions IA
* Compréhension des contraintes de production (latence, coût)
4. Profil recherché
* Expérience de 8 ans minimum en développement Python ( niveau avancé)
* Expérience sur des projets IA / NLP / LLM
* Bonne compréhension des architectures modernes
* Capacité à travailler en autonomie
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.