[74533] Centre Hospitalier Universitaire d'Angers
CONTEXTE
Situé au coeur de la ville d'Angers et du Campus santé, le CHU d'Angers met en oeuvre et exploite un entrepôt de données de santé. En charge de l'exploitation de cet entrepôt, le CDC a pour objectifs de contribuer à l'amélioration des soins par l'analyse et la réutilisation des données médicales et leur mise à disposition des chercheurs cliniciens dans un cadre sécurisé et dans le respect de la réglementation. Le CDC intervient sur des projets de recherche régionaux et nationaux.
Pour le développement de cette activité, le Département Sciences de la Donnée de la Direction de la Recherche et Innovation du CHU d'Angers (DRI) recrute un ingénieur en traitement automatique du langage (TAL).
MISSIONS ET ACTIVITES
Développer et mettre en oeuvre des méthodes d'analyse et de modélisation pour exploiter le langage naturel et les données textuelles issues des comptes rendus (CR) et bases structurées, dans le but d'en extraire des concepts, et automatiser la compréhension des documents.
-Extraction et qualification de concepts à partir de textes et données structurées (ex. pathologies, traitements, observations).
-Enrichissement sémantique des données via des graphes de connaissances, lexiques métiers, embeddings ou ontologies médicales.
-Classification automatique de documents (machine learning, deep learning, LLM) selon des typologies définies.
-Préparation, nettoyage et annotation de corpus pour entraîner des modèles NLP (NER, text classification, relation extraction.).
-Évaluation et benchmark des modèles (Hugging Face, spaCy, modèles propriétaires, etc.).
-Data visualization et restitution claire des résultats auprès des équipes métier et recherche.
-Contribution aux études complexes mêlant texte, données structurées et raisonnement statistique.
Description du profil recherché:
COMPETENCES REQUISES
· Langage : Python (Pandas, Scikit-learn, PyTorch, Transformers, spaCy, NLTK).
· Data engineering léger : SQL, manipulation de données textuelles volumineuses.
· Outils NLP : Hugging Face, spaCy, fastText, embeddings (Word2Vec, BERT, etc.).
· MLOps basique : MLflow, Streamlit, API REST pour servir des modèles (souhaité).
· DataViz : Plotly, Matplotlib, ou équivalent.
· Connaissance des ontologies médicales ou terminologies métier (SNOMED, UMLS.) (souhaité)
AUTRES INFORMATIONS SUR LE POSTE
Profil recherché
Formation Bac+5 / PhD en Data Science, Informatique, TAL ou domaine équivalent.
Expérience confirmée (ou stage solide) en NLP appliqué à des données métier.
Capacité à passer du besoin métier à la mise en production d'un modèle.
Capacité à travailler en équipe, à gérer la mise en oeuvre d'un projet et sa documentation technique.
Curiosité, rigueur scientifique, sens de la communication.
Temps de travail
39h/semaine, 28j de congés annuels, 20 jours de RTT, 1 jour de télétravail possible / semaine
Contrat
CDD d'un an renouvelable
Rémunération : selon grilles de la fonction publique hospitalière (en fonction du diplôme et de l'expérience)
Pour postuler, merci de déposer votre CV et lettre de motivation sur la plateforme Mstaff.
Horaires : Horaires normaux
Période de la journée : Jour
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.