Informations générales
Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public
Intitulé de l'offre : Ingénieur-e de recherche en apprentissage statistique H/F
Référence : UMR7641-MOBINT-P59006
Lieu de travail : PALAISEAU
Institut : INSMI - Institut national des sciences mathématiques et de leurs interactions
Date de publication : mardi 2 décembre 2025
Session : Campagne Hiver 2026
Groupe de Fonction : IRG3
BAP : E - Informatique, Statistiques et Calcul scientifique
Emploi type : Experte ou expert en information statistique
Missions
La missions de l'ingénieur-e est de valoriser la recherche en apprentissage statistique portée par le laboratoire, et en particulier par l'équipe SIMPAS, à travers la conception et le développement de librairies scientifiques open-source et sous la forme de participation à des projets de recherche nécessitant de l'ingénierie (GPU, deep learning).
Activités
Activités principales :
- Aider à la gestion du cluster du laboratoire, en particulier les GPUs,
- Développer des librairies logicielles de recherche libres,
- Développer de codes en lien avec les travaux de recherche des membres du laboratoire.
Activités secondaires :
- Rechercher de solutions pour mettre à l'échelle les méthodes et algorithmes développés au sein du laboratoire,
- Concevoir, développer ou adapter des méthodes d'analyse : calcul numérique, statistique, traitement du signal, traitement d'images, modélisation,
- Conduire des projets techniques qui concourent à la résolution d'une problématique scientifique dans ses dimensions techniques, humaines et administratives,
- Assurer une veille technologique sur l'évolution des architectures matérielles, des systèmes, et les techniques numériques d'optimisation et parallélisation de codes,
- S'investir dans la formation des utilisateurs et veiller au transfert des connaissances ou des savoir-faire les plus récents, en particulier par la rédaction de documentation,
- Participer aux réseaux métiers de développeurs, locaux ou nationaux,
- Apporter son soutien à la pérennisation de codes développés dans le cadre de doctorats, postdoctorats ou contrats.
Plus particulièrement, les projets immédiats auxquels l'ingénieur pourrait participer sont :
- Poursuivre le développement de la librairie Kooplearn dédiée à l'analyse des systèmes dynamiques stochastiques et l'apprentissage de représentation,
- Poursuivre le développement de la librairie POT dédiée au transport optimal computationnel, ainsi que SKADA dédié à l'adaptation de domaine,
- Développer des solutions logicielles pour l'apprentissage fédéré et l'assistance de preuves par ordinateurs,
- Initier la création d'un logiciel open-source permettant l'utilisation des méthodes génératives par diffusion les plus réputées, ainsi que la mise en place d'un benchmark pertinent pour les nouvelles méthodes en cours de développement.
Compétences
Compétences techniques :
- Maîtrise des algorithmes d'apprentissage statistique : techniques d'apprentissage avancés (ex: réseaux de neurones, méthodes bayésiennes, modèles génératifs),
- Programmation et développement logiciel : Maîtrise des langages de programmation couramment utilisés en data science (Python) et des bibliothèques scientifiques (TensorFlow, PyTorch, ,
- Gestion de données et pipelines de traitement : Capacité à manipuler et traiter de grands volumes de données, construire des pipelines de traitement efficaces, et exploiter des techniques d'ETL (Extract Transform, Load) pour intégrer des données dans des systèmes d'apprentissage,
- Mathématiques appliquées et statistiques : solide compréhension des concepts mathématiques sous-jacents aux méthodes d'apprentissage statistique, tels que les probabilités, l'optimisation, la théorie des graphes, et les statistiques inférentielles,
- Gestion de l'infrastructure et du cloud : compétences en gestion des infrastructures de calcul, notamment l'utilisation de clusters de calcul sous slurm et de services cloud (AWS, Azure, GCP), ainsi que l'optimisation des ressources GPU pour l'entraînement de modèles complexes.
Compétence opérationnelle :
- Compétences en communication scientifique : rédaction d'articles de recherche, documentation des résultats, présentation des travaux lors de conférences ou de réunions internes.
Savoir-être :
- Travail d'équipe et collaboration interdisciplinaire : Savoir travailler en équipe avec des chercheurs, data scientists, et ingénieurs dans un environnement pluridisciplinaire.
Note importante : Ces compétences sont attendues pour mener à bien les missions mais peuvent tout à fait être acquises en poste si le candidat a montré ses capacités d'adaptation. Elle/il pourra avoir accès à des formations spécifiques (IDRIS) et pourra développer ses connaissances en apprentissage statistique à travers le développement open source prévu dans les missions.
Contexte de travail
Le Centre de Mathématiques Appliquées (CMAP), UMR 7641, est le laboratoire de Mathématiques Appliquées de l'École polytechnique à Palaiseau (91). Il est placé sous la tutelle primaire de l'École polytechnique et du CNRS et sous la tutelle secondaire d'Inria. Il a pour objectif le développement et l'exploration des mathématiques en liaison avec les applications.
L'ouverture du CMAP à d'autres disciplines (physique, mécanique, biologie,, la variété et la complexité de ses thèmes de recherche permettent à ses équipes (47 chercheurs ou enseignants-chercheurs permanents, une soixantaine de doctorants, une vingtaine de post-doctorants ainsi que de nombreux visiteurs et chercheurs invités) d'explorer et d'initier des thématiques nouvelles.
L'ingénieur-e sera membre du CMAP et plus précisément de l'équipe SIMPAS, spécialisée dans le domaine de l'apprentissage et de l'intelligence artificielle. Elle/il travaillera sous la responsabilité des chefs d'équipe, et pourra inteagir avec tous les membres de celles-ci.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.