Staff ai engineer

Paris

Partnered

Télétravail partiel

Publiée le Il y a 11 h

Mission du poste

Partnered accompagne une Startup dans la recherche d'un Staff Engineer sur des enjeux AI

Le rôle

Tu seras responsable de construire des systèmes Data & AI à fort impact business.

Tu travailleras sur des problèmes concrets : mieux qualifier la demande client, améliorer le matching entre entreprises et prestataires, automatiser des opérations complexes, prioriser les opportunités, enrichir la connaissance client, assister les équipes internes, ou créer des agents capables d’orchestrer plusieurs outils.

Ton rôle : prendre un problème ambigu, comprendre les données, choisir la bonne approche, builder une solution robuste, la mettre en prod et prouver qu’elle crée de la valeur.

Tu seras attendu·e sur trois dimensions :

Comprendre le problème business en profondeur
Construire vite et proprement
Mesurer l’impact réel en production

Le tout avec un haut niveau d’autonomie.

Ce que tu feras concrètement

1. Builder des systèmes IA en production

Concevoir et déployer des modèles ML, pipelines RAG, agents et workflows agentiques.

Construire des APIs et services backend pour exposer tes systèmes en production.

Transformer des données business — événements, historiques, comportements, transactions, contexte opérationnel — en signaux exploitables par des modèles ou agents.

Créer des systèmes capables d’orchestrer plusieurs outils internes ou externes.

Passer rapidement d’une hypothèse à une première version utilisable.

Assumer l’ownership complet de ce que tu livres : qualité, fiabilité, coût, latence, adoption, impact.

2. Construire des agents et workflows fiables

Développer des workflows agentiques capables de résoudre des tâches métier complexes.

Concevoir les bons outils, contextes, étapes de raisonnement, garde-fous et stratégies de fallback.

Améliorer la qualité des réponses et décisions produites par les LLMs.

Travailler sur des systèmes multi-étapes : récupération de contexte, appel d’outils, validation, action, monitoring.

Rendre des systèmes non déterministes suffisamment fiables pour être utilisés en production.

3. Mesurer, monitorer, améliorer

Définir les bonnes métriques pour savoir si un modèle, un prompt, un agent ou un workflow s’améliore vraiment.

Construire des evals, benchmarks et datasets de validation.

Mettre en place du monitoring sur la qualité, les erreurs, la latence, les coûts, les hallucinations, les edge cases et

l’impact business.

Optimiser les coûts d’inférence et la latence à mesure que les usages scalent.

Itérer rapidement à partir des retours terrain et des signaux de production.

Savoir arrêter ou simplifier une approche quand elle ne crée pas assez de valeur.

Qui tu es ?

Expert builder

Tu es un profil très hands-on. Tu aimes construire toi-même, comprendre les détails, tester, shipper, mesurer. Tu n’as pas besoin qu’un problème soit parfaitement cadré pour avancer.

Staff-level individual contributor

Tu as le niveau d’autonomie, de jugement et d’exigence d’un profil Staff, mais ton impact passe d’abord par ce que tu construis. Tu peux influencer, challenger et aider les autres, mais ce n’est pas le cœur du rôle. Le cœur du rôle, c’est de builder des systèmes qui marchent.

Hands-on avec les systèmes IA modernes

Tu as déjà travaillé avec des LLMs dans un vrai contexte produit ou business. Tu comprends les sujets de contexte, prompt, RAG, agents, tool use, évaluation, monitoring, latence et coûts.

Orienté production

Tu ne t’arrêtes pas au notebook ou au prototype. Tu sais construire des services robustes, observables, maintenables, et tu te sens responsable de ce qu’ils deviennent une fois en production.

Business-first

Tu ne pars pas du modèle. Tu pars du problème. Tu poses les bonnes questions, tu identifies le levier business, tu choisis l’approche la plus pragmatique, puis tu mesures l’impact.

Ce qu’on cherche

Requis

7+ ans d’expérience en Data Science, Machine Learning Engineering, AI Engineering ou Software Engineering orienté data/IA — ou un parcours plus court mais exceptionnellement pertinent.
Expérience forte de systèmes ML, data ou IA réellement utilisés en production.
Très bon niveau Python, SQL et MongoDB.
Capacité à construire des APIs et services backend, par exemple avec FastAPI ou équivalent.
Expérience concrète avec les LLMs dans un contexte produit ou opérationnel.
Expérience avec des systèmes RAG, agents, workflows agentiques, tool use ou orchestration.
Capacité à définir des métriques d’évaluation : qualité, taux d’échec, précision, coût, latence, impact business.
Expérience du monitoring et de l’observabilité de systèmes data/IA en production.
Forte autonomie dans des environnements ambigus.
Capacité à prendre un sujet de bout en bout : exploration, design, build, prod, mesure, itération.

Ce qui te différencie

Tu as déjà construit des agents ou workflows agentiques utilisés en production.

Tu as déjà mis en place des evals ou benchmarks pour des systèmes LLM.

Tu as déjà optimisé le coût ou la latence d’inférence en production.

Tu es capable de choisir entre ML classique, règles métier, RAG, LLM, agent ou simple workflow produit.

Tu sais construire des systèmes simples pour des problèmes complexes.

Tu as déjà travaillé sur des sujets de recommandation, scoring, ranking, NLP ou automatisation métier.

Tu sais parler à des équipes business pour comprendre le problème, puis retourner builder sans attendre trois semaines de specs.

Stack

Langages : Python, SQL, MongoDB

Backend / APIs : FastAPI, APIs internes, services orientés production

ML classique : scikit-learn, XGBoost, scoring, recommandation, ranking, classification

IA générative : LLMs, RAG, agents, workflows agentiques, prompt engineering, tool use

Orchestration agentique : LangGraph, LangChain

Évaluation & observabilité IA : LangSmith, evals, benchmarks, métriques qualité, datasets de validation

Recherche & retrieval : Elasticsearch, Pinecone, autre

Monitoring production : qualité des sorties, erreurs, latence, coûts, drift, hallucinations, edge cases

Cloud / infra : GCP ou équivalent

Ce qu’on t’offre

Un rôle Staff très hands-on, centré sur le build.
Des problèmes business concrets, avec un impact direct sur la performance
La possibilité de construire des systèmes IA de bout en bout : données, modèle, agent, API, monitoring, impact.
Beaucoup d’autonomie et peu d’inertie.
Une organisation en pods où les décisions se prennent vite.
Une exposition directe aux utilisateurs internes, aux équipes business et aux enjeux opérationnels.
Hybride : 3 jours à Paris, 2 jours en remote.
Rémunération : à calibrer selon expérience et séniorité.

Postuler

Créer une alerte

Sauvegarder

Voir plus d'offres d'emploi

Estimer mon salaire

JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.