Ingénieur de recherche F/H en Sciences des Données Niveau de diplôme exigé : Bac 5 ou équivalent Fonction : Ingénieur scientifique contractuel Contexte et atouts du poste Ce poste s'inscrit dans le projet collaboratif ANR EDyLES 2. Ce projet vise à développer, appliquer et diffuser des modèles dynamiques flexibles ainsi que des estimandes pertinentes en épidémiologie, en exploitant les données longitudinales complexes issues des cohortes. La richesse des mesures répétées permet d'aborder des questions avancées sur les mécanismes, les facteurs de risque et la progression des maladies, tout en intégrant la dimension dynamique et multidimensionnelle des processus de santé. Cependant, les méthodes actuelles peinent à représenter simultanément la dynamique continue des processus, leurs interactions complexes et l'imperfection des mesures (bruit, visites irrégulières, données manquantes, hétérogénéité, nature variée des observations). Ces limites restreignent le potentiel des cohortes en recherche épidémiologique. Les réseaux de neurones récurrents, en particulier les approches de reservoir computing développées dans l'équipe Mnemosyne, offrent une voie prometteuse pour modéliser ces relations dynamiques. Leur usage reste toutefois difficile en présence de trajectoires bruitées, irrégulières ou tronquées, comme celles observées dans les études de cohorte. Un package R, mixedML, a récemment été développé pour estimer des modèles à effets mixtes dont la partie fixe peut être inférée par un réseau de neurones. L'objectif du poste est de tester et de faire évoluer cet outil afin de permettre une utilisation large, en intégrant de nouvelles approches d'apprentissage automatique. Mission confiée La mission principale: Ce poste a pour but de développer des approches hybrides combinant réseaux de neurones et modèles biostatistiques pour l'analyse de données longitudinales issues d'études de cohortes. L'ingénieur ou ingénieure de recherche en science des données poursuivra la mise en place d'une première infrastructure intégrant reservoir computing et modèle mixte, développée sous R pour la prédiction d'une variable répétée. Cette infrastructure devra être étendue vers plusieurs axes, notamment la prise en compte des données manquantes et la gestion de l'erreur de mesure sur les variables explicatives. Principales activités - Activités principales - Participation à la réflexion et aux choix méthodologiques - Préparation et participation aux réunions de travail sur les projets - implémentation de nouvelles méthodologies sous R - validation par des études de simulation - Mise en oeuvre des analyses statistiques sur les données de cohortes - Exploitation et présentation des résultats - Participation à la valorisation de la recherche, à la rédaction des articles scientifiques et à la dissémination des résultats - Le cas échéant, activités associées - Participation à la réflexion méthodologique des équipes - Participation aux autres travaux statistiques des équipes Compétences Aptitudes souhaitées: - Rigueur, autonomie - Sens de l'organisation, travail en équipe - Esprit de synthèse, capacités de restitution et d'adaptation à divers publics (épidémiologistes, neurologues, informaticiens, mathématiciens). - Débutant.e accepté.e Avantages - Restauration subventionnée - Transports publics remboursés partiellement - Possibilité de télétravail et aménagement du temps de travail - Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.) - Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria) - Accès à la formation professionnelle - Sécurité sociale Rémunération Selon niveau d'expérience professionnelle
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.