Le Centre Léon Bérard (#CLB), membre de la fédération Unicancer, est LE pôle de référence régional en cancérologie. Regroupant 2.300 collaborateurs sur un site unique à Lyon 8ème, nous sommes à la fois un hôpital et un centre de recherche.
Nous assurons 3 missions essentielles :
- Le soin : nos équipes soignantes prennent en charge plus de 42.000 patients par an, avec des soins personnalisés et innovants
- La recherche : nos chercheurs et médecins travaillent main dans la main, couvrant les domaines de la recherche fondamentale, translationnelle et clinique
- L'enseignement : chaque année, nous assurons la diffusion des savoirs et formons nos collaborateurs et des professionnels extérieurs Dans le cadre d'une création de poste, nous recrutons pour renforcer notre Data Factory : Data Engineer - Développeur Python (F/H) - CDD de 18 mois - temps plein.
LE PROJET :
Le CLB est impliqué dans des projets d'intelligence artificielle depuis plusieurs années avec des partenariats académiques et industriels. Ces projets bénéficient de notre importante base de données de plus de 340 000 patients dans un dossier patient développé en interne et qui a été progressivement informatisé depuis 1993.
Depuis quelques années, le CLB s'est engagé dans des projets intégrant l'Intelligence Artificielle (IA) et les Big Data en santé. Les prérequis à l'utilisation des données de santé et l'intégration de l'IA en routine est la disponibilité de données structurées et de qualité. C'est devant cette nécessité que la Data Factory a été créée en 2021, dont les objectifs sont de structurer et fiabiliser les données, ce qui implique notamment :
- Rendre exploitable (extraire l'information utile) une grande quantité de données disponible
- Élargir le périmètre des données interconnectées, structurées et requêtables
- À plus long terme, la création d'un gisement de données multi-sources, réparti et accessible pour les cliniciens et les chercheurs, basé sur le modèle de données OSIRIS.
L'équipe Data Factory est dédiée à la mise en oeuvre et au pilotage de projets de réutilisation de données massives (Big Data). Elle permet l'extraction et le traitement de données des données de santé à destination des projets de recherche clinique ou des industriels.
En tant que Data Engineer / Développeur, vous êtes impliqué dans le projet "OncoDS".
OncoDS" est un programme permettant de concevoir une infrastructure unique de partage de données en mettant en réseau les 12 entrepôts locaux des Centres de Lutte Contre le Cancer et en constituant une infrastructure centrale au niveau d'UNICANCER pouvant héberger des projets multicentriques : OncoDS - Unicancer. Dans le cadre de ce projet, le Centre Léon Bérard a la charge de concevoir un outil de qualité intrinsèque des données. Le POC a été réalisé et nous devons industrialiser l'outil. Un cahier des charges incluant les contraintes que doit respecter l'outil sera à disposition du développeur.
LE POSTE ET LES MISSIONS :
Rattaché hiérarchiquement au Directeur des Systèmes d'Information et à la Responsable de la Data Factory, vous participez au développement, à la maintenance et à l'optimisation des pipelines ETL existants, développés en Python. Ces scripts permettent de structurer, nettoyer et standardiser des données hétérogènes issues de multiples sources (bases de données, fichiers plats, exports spécifiques, etc.) pour les rendre conforme aux standards/ format cible OSIRIS et OSIRIS RWD. Vous serez en lien très fort avec les équipes scientifiques porteuses de projet.
Vous serez amené à :
- Contribuer à la définition des spécifications générales
- Réaliser l'analyse technique (architecture, choix des composants, prototypage, compatibilité avec les technologies existantes)
- Développer et tester les modules avant d'assurer leur déploiement auprès des utilisateurs finaux que vous formerez ainsi que leur maintenance
- Réaliser des analyses de données simples
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.