Consultant technique confirmé ai (h/f)

Saint-Ouen-l'Aumône

Inetum

Publiée le 31 mai

Description de l'offre

Description du poste

* Concevoir, entraîner, optimiser et déployer des modèles de Machine Learning et Deep Learning (NLP, LLM, embeddings).
* Développer et maintenir des pipelines ML robustes (entraînement, évaluation, monitoring, CI/CD).
* Construire des architectures RAG incluant : ingestion de documents, stratégie de chunking, embeddings, vector stores, pipelines de retrieval & génération.
* Implémenter des applications LLM avec LangChain / LangGraph (agents, tools, retrievers, flows).
* Déployer des microservices IA (API FastAPI / Flask) et gérer leur scalabilité en production.
* Optimiser l'inférence et les performances : latence, consommation GPU, parallélisation, batching.
* Collaborer avec les équipes Data Engineering, Produit et Dev pour industrialiser les solutions.
* Surveiller les modèles en production (drift, performance, dérive des données).

Qualifications

* Excellente maîtrise de Python (structuration du code, tests unitaires, design patterns).
* Expertise en NLP / Deep Learning : PyTorch, TensorFlow, Transformers (HuggingFace).
* Expérience concrète sur des projets LLM, fine‑tuning, prompt engineering.
* Maîtrise des architectures RAG : embeddings, vector stores (FAISS, Chroma, Milvus…), retrieval.
* Expérience sur LangChain / LangGraph / LlamaIndex.
* Solide niveau en API engineering : FastAPI, Flask.
* Connaissances MLOps :
o Docker, CI/CD (GitLab, GitHub Actions, Azure DevOps…)
o MLflow, Weights & Biases, DVC
o Kubernetes (souhaité), orchestration (Airflow / Prefect)
* Maîtrise d’un cloud : AWS, GCP ou Azure (un plus si Azure OpenAI, Bedrock, Vertex AI).

Compétences appréciées :

* Connaissance des bases vectorielles avancées (SHARED / HNSW / IVF).
* Optimisation GPU, quantization (GPTQ, GGUF, vLLM).
* Expérience en ingestion de documents (OCR, parsing PDF/HTML).
* Expérience LLMOps (observabilité, monitoring, guardrails).

Profil attendu :

* Autonomie & pragmatisme : capable de poser un diagnostic, proposer une solution et la livrer.
* Culture GenAI & LLM : curiosité forte, veille active, envie d’expérimenter et d’améliorer en continu.
* Collaboration fluide : bon communicant, à l’aise avec les équipes Produit, Data et Software.
* Orientation impact : focus sur le concret, la performance et la valeur métier plutôt que l’expérimentation théorique.

Postuler

Créer une alerte

Sauvegarder

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.