Contexte et atouts du poste
Dans le cadre de NeuroKnowAI, un projet de start-up deep tech issu de la recherche. Ce projet fait actuellement partie du programme d'accélération Inria Startup Studio. NeuroknowAI est une plateforme de traitement intelligent de documents axée sur la confidentialité et dotée de connaissances spécialisées dans divers secteurs.
L'objectif est de développer et d'intégrer des modèles d'IA et des pipelines de traitement de documents plus spécifiquement dédiés au traitement intelligent de documents multi-secteurs (assurance, santé, juridique, finance, médias, RH, marketing, immobilier) avec une architecture axée sur la confidentialité.
Aucun déplacement régulier n'est prévu pour ce poste. Le travail s'effectue principalement sur site (quelques jours de télétravail sont possibles).
Mission confiée
Missions :
Avec l'aide de l'équipe technique de NeuroKnowAI, la personne recrutée concevra, développera et optimisera des modèles d'apprentissage automatique pour le traitement intelligent de documents, notamment des modèles Transformer, la reconnaissance d'entités nommées (NER) et des algorithmes de confidentialité différentielle.
Collaboration :
La personne recrutée sera en contact avec l'équipe de R&D qui développe les produits NeuroDoc, NeuroShield et NeuroGuard afin d'assurer l'intégration des modèles d'apprentissage automatique dans l'infrastructure de production.
Responsabilités :
La personne recrutée sera chargée de concevoir et de mettre en œuvre des modèles d'apprentissage automatique spécifiques à l'industrie et prendra des initiatives pour améliorer les performances, la précision et l'efficacité des pipelines de traitement des documents.
Pilotage/gestion :
La personne recrutée sera chargée de documenter les développements techniques et de contribuer aux décisions architecturales en matière d'apprentissage automatique.
Principales activités
Activités principales :
1. Développer et former des modèles Transformer pour le traitement multimodal de documents (OCR, reconnaissance vocale, analyse de texte)
2. Concevoir des modèles NER spécifiques à certains secteurs (santé, droit, finance, assurance, etc.)
3. Mettre en œuvre des algorithmes de confidentialité différentielle pour NeuroShield
4. Optimiser les pipelines ML pour un traitement haute performance (multi-GPU, calcul à précision mixte)
5. Intégrer les modèles dans l'infrastructure de recherche sémantique
Activités complémentaires :
1. Rédiger la documentation technique et les rapports de performance
2. Tester, modifier et valider les modèles avant leur déploiement en production
3. Présenter l'avancement des travaux aux partenaires et à l'équipe
Compétences
Compétences techniques et niveau requis :
1. Python : expert
2. PyTorch ou TensorFlow : avancé
3. Hugging Face Transformers : avancé
4. NLP et traitement de documents : avancé
5. OCR et traitement multimodal : intermédiaire à avancé
6. Optimisation GPU (CUDA, précision mixte) : intermédiaire
7. MLOps (Docker, CI/CD, déploiement de modèles) : intermédiaire
8. Git et contrôle de version : avancé
Langues :
9. Anglais : courant (documentation technique, communication au sein de l'équipe)
10. Français : apprécié mais pas obligatoire
Compétences relationnelles :
11. Capacité à communiquer clairement des concepts techniques complexes
12. Esprit d'équipe et collaboration
13. Autonomie et initiative
14. Adaptabilité dans un environnement en évolution rapide
Autres valeurs appréciées :
15. Expérience des techniques de confidentialité différentielle
16. Connaissance des réglementations en matière de protection des données (RGPD, HIPAA)
17. Expérience dans le traitement de documents spécifiques à un secteur (santé, juridique, finance)
18. Contributions open source ou publications scientifiques
Avantages
19. Restauration subventionnée
20. Transports publics remboursés partiellement
21. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
22. Possibilité de télétravail et aménagement du temps de travail
23. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
24. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
25. Accès à la formation professionnelle
26. Sécurité sociale
Rémunération
Selon le profil
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.