Startup issue du domaine de la propriété intellectuelle, développant des solutions d'intelligence artificielle pour les experts de la protection des innovations.
Nos outils exploitent la vision, le NLP et l'apprentissage explicable pour assister les professionnels du droit : détection de similarités, génération d'arguments, rédaction de brevets et analyse de portefeuilles.
Nous opérons à l'interface entre recherche académique et ingénierie logicielle (Python, PyTorch, Docker, PostgreSQL, OVHCloud, modèles multimodaux).
Notre objectif : rendre l'IA juridique interprétable, fiable et utile.
Description du poste
Rattaché(e) au responsable R&D, le/la Data Scientist Vision-NLP interviendra sur tout le cycle de développement des modèles : conception, entraînement, validation et déploiement.
Le poste combine recherche appliquée, ingénierie de données et modélisation explicable.
Missions principales
1. Extraction et préparation des données
- Développement de pipelines d'ingestion (textes, images, décisions, marques).
- Extraction structurée depuis XML, PDF, JSON et images (OCR, parsing).
- Nettoyage, normalisation et enrichissement sémantique (lemmatisation, entités, classes).
2. Modélisation et apprentissage
- Conception de modèles de vision (SigLIP, CLIP, ViT, CNN) pour logos et marques.
- Développement NLP : embeddings, fine-tuning de transformers, classification multi-label.
- Construction de modèles interprétables (SHAP, LIME, attention weights).
- Évaluation expérimentale et définition de métriques adaptées aux usages PI.
3. Mise en production
- Intégration dans des conteneurs Docker, automatisation des déploiements.
- Collaboration avec les ingénieurs backend pour l'exposition via API.
- Suivi des performances, retraining périodique et documentation technique.
4. Recherche et innovation
- Veille scientifique sur Similarity Learning, Explainable AI, Vision-Language Models.
- Participation aux orientations R&D, rédaction de rapports techniques.
- Contribution à des projets de recherche académiques et partenariaux.
Profil recherché
Formation
Master 2 ou Doctorat en IA, Informatique, NLP, Vision par ordinateur ou domaine proche.
Une connaissance de la propriété intellectuelle (marques, brevets, classification de Nice) est appréciée.
Expérience
1 à 3 ans en data science, recherche appliquée ou modélisation IA (stages inclus).
Expériences concrètes en NLP et/ou Vision : prototypes, publications ou produits.
Pratique de la mise en production (Docker, FastAPI, Kubernetes ou équivalent).
Compétences techniques
Python, PyTorch/TensorFlow, scikit-learn, pandas, NumPy.
Vision : CLIP, SigLIP, ViT, CNN, OpenCV.
NLP : BERT, MPNet, Gemma, embeddings, fine-tuning, similarity learning.
Interprétabilité : SHAP, LIME, feature importance, attention visualization.
DevOps/Infra : Docker, Git, PostgreSQL, FastAPI, OVHCloud/AWS.
Formats : XML, JSON, SQL, OCR, ensembles multimodaux.
Qualités professionnelles
Rigueur scientifique et documentation précise.
Autonomie, sens expérimental et aptitude au travail interdisciplinaire.
Intérêt pour l'IA explicable et la reproductibilité des modèles.
Localisation : Pau (télétravail partiel)
Rémunération : selon profil (32 000 € - 34 000 € brut/an)
Prise de poste : dès que possible
Équipement : GPU local et cloud, corpus internes de PI
Encadrement : équipe R&D mixte (chercheurs, ingénieurs, juristes)
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.