Partnered accompagne une Startup dans la recherche d'un Staff Engineer sur des enjeux AI
Le rôle
Tu seras responsable de construire des systèmes Data & AI à fort impact business.
Tu travailleras sur des problèmes concrets : mieux qualifier la demande client, améliorer le matching entre entreprises et prestataires, automatiser des opérations complexes, prioriser les opportunités, enrichir la connaissance client, assister les équipes internes, ou créer des agents capables d’orchestrer plusieurs outils.
Ton rôle : prendre un problème ambigu, comprendre les données, choisir la bonne approche, builder une solution robuste, la mettre en prod et prouver qu’elle crée de la valeur.
Tu seras attendu·e sur trois dimensions :
Le tout avec un haut niveau d’autonomie.
Ce que tu feras concrètement
1. Builder des systèmes IA en production
Concevoir et déployer des modèles ML, pipelines RAG, agents et workflows agentiques.
Construire des APIs et services backend pour exposer tes systèmes en production.
Transformer des données business — événements, historiques, comportements, transactions, contexte opérationnel — en signaux exploitables par des modèles ou agents.
Créer des systèmes capables d’orchestrer plusieurs outils internes ou externes.
Passer rapidement d’une hypothèse à une première version utilisable.
Assumer l’ownership complet de ce que tu livres : qualité, fiabilité, coût, latence, adoption, impact.
2. Construire des agents et workflows fiables
Développer des workflows agentiques capables de résoudre des tâches métier complexes.
Concevoir les bons outils, contextes, étapes de raisonnement, garde-fous et stratégies de fallback.
Améliorer la qualité des réponses et décisions produites par les LLMs.
Travailler sur des systèmes multi-étapes : récupération de contexte, appel d’outils, validation, action, monitoring.
Rendre des systèmes non déterministes suffisamment fiables pour être utilisés en production.
3. Mesurer, monitorer, améliorer
Définir les bonnes métriques pour savoir si un modèle, un prompt, un agent ou un workflow s’améliore vraiment.
Construire des evals, benchmarks et datasets de validation.
Mettre en place du monitoring sur la qualité, les erreurs, la latence, les coûts, les hallucinations, les edge cases et
l’impact business.
Optimiser les coûts d’inférence et la latence à mesure que les usages scalent.
Itérer rapidement à partir des retours terrain et des signaux de production.
Savoir arrêter ou simplifier une approche quand elle ne crée pas assez de valeur.
Qui tu es ?
Expert builder
Tu es un profil très hands-on. Tu aimes construire toi-même, comprendre les détails, tester, shipper, mesurer. Tu n’as pas besoin qu’un problème soit parfaitement cadré pour avancer.
Staff-level individual contributor
Tu as le niveau d’autonomie, de jugement et d’exigence d’un profil Staff, mais ton impact passe d’abord par ce que tu construis. Tu peux influencer, challenger et aider les autres, mais ce n’est pas le cœur du rôle. Le cœur du rôle, c’est de builder des systèmes qui marchent.
Hands-on avec les systèmes IA modernes
Tu as déjà travaillé avec des LLMs dans un vrai contexte produit ou business. Tu comprends les sujets de contexte, prompt, RAG, agents, tool use, évaluation, monitoring, latence et coûts.
Orienté production
Tu ne t’arrêtes pas au notebook ou au prototype. Tu sais construire des services robustes, observables, maintenables, et tu te sens responsable de ce qu’ils deviennent une fois en production.
Business-first
Tu ne pars pas du modèle. Tu pars du problème. Tu poses les bonnes questions, tu identifies le levier business, tu choisis l’approche la plus pragmatique, puis tu mesures l’impact.
Ce qu’on cherche
Requis
Ce qui te différencie
Tu as déjà construit des agents ou workflows agentiques utilisés en production.
Tu as déjà mis en place des evals ou benchmarks pour des systèmes LLM.
Tu as déjà optimisé le coût ou la latence d’inférence en production.
Tu es capable de choisir entre ML classique, règles métier, RAG, LLM, agent ou simple workflow produit.
Tu sais construire des systèmes simples pour des problèmes complexes.
Tu as déjà travaillé sur des sujets de recommandation, scoring, ranking, NLP ou automatisation métier.
Tu sais parler à des équipes business pour comprendre le problème, puis retourner builder sans attendre trois semaines de specs.
Stack
Langages : Python, SQL, MongoDB
Backend / APIs : FastAPI, APIs internes, services orientés production
ML classique : scikit-learn, XGBoost, scoring, recommandation, ranking, classification
IA générative : LLMs, RAG, agents, workflows agentiques, prompt engineering, tool use
Orchestration agentique : LangGraph, LangChain
Évaluation & observabilité IA : LangSmith, evals, benchmarks, métriques qualité, datasets de validation
Recherche & retrieval : Elasticsearch, Pinecone, autre
Monitoring production : qualité des sorties, erreurs, latence, coûts, drift, hallucinations, edge cases
Cloud / infra : GCP ou équivalent
Ce qu’on t’offre
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.