Mission :
Nous recherchons un ingénieur de recherche créatif pour rejoindre l'équipe du LSCE-CNRS qui développe des méthodes avancées de suivi des forêts avec des données d'images satellites et des modèles de deep learning qui sont basés sur de très gros volumes de données. Depuis plus de trois ans, le groupe a développé de nouveaux modèles de fusion de données de télédétection spatiale optique, radar et LiDAR pour permettre un suivi des paramètres biophysiques des forêts dans le monde à haute résolution spatiale et temporelle [1,2]. Nous pouvons désormais faire fonctionner avec succès des modèles pour cartographier la hauteur et la biomasse des forêts. Nos travaux récents ont montré que des cartes précises de ces paramètres apportent des informations cruciales pour mesurer la croissance et la mortalité, et les changements de stocks de carbone des arbres. Nous souhaitons poursuivre ces développements et améliorer fortement les codes de recherche existants afin de disposer de modèles utilisable par tous les membres de l'équipe et des collaborateurs extérieurs pour le pré-traitement des données brutes à partir de plateformes comme Google Earth Engine, et l'apprentissage et validation de modèles de deep learning d'architectures différentes (Unet, Vision Transformers, Modèles de Fondation)
Une partie des tâches du candidat retenu consistera à accompagner les développeurs des éléments logiciels GEEFetch et SPOUT au LSCE sur le serveur national Jean Zay qui dispose de nombreux GPU et stockage, pour y intégrer de nouvelles fonctions comme l'intégration de données de nouveaux capteurs spatiaux ALOS PALSAR, BIOMASS et NISAR. Le candidat participera à l'avancée des connaissances en améliorant les taches de pre-processing et d'optimisation de stockage des données ( jusqu'à 2 PB) et participera à des Hackatons organisés par Jean Zay et NVIDIA pur optimiser notre stack de développement sur des GPU récents en travaillant notamment sur des méthodes avancées de compression de données pour réduire la mémoire utilisées et le stockage des images à très haute résolution spatiale.
Le candidat retenu contribuera aussi à l'optimisation des codes de deep learning et au support des membres de l'équipe qui l'utilisent. Il sera associé et contribuera à des publications de recherche pour des conférences de Machine Learning ICML, NEURILPS. Co-supervision de stagiaires est envisagée
[1] Fayad, I., Ciais, P., Schwartz, M., Wigneron, J.P., Baghdadi, N., de Truchis, A., d'Aspremont, A., Frappart, F., Saatchi, S., Pellissier-Tanon, A., Bazzi, H., 2023. Vision Transformers, a new approach for high-resolution an of canopy heights. URL: http://arxi664v.org/abs/2304.11487, doi:10.48550/arXiv.2304.11487. arXiv:2304.11487 [cs, eess].
[2] Schwartz, M., Ciais, P., De Truchis, A., Chave, J., Ottlé, C., Vega, C., Wigneron, J.-P., Nicolas, M., Jouaber, S., Liu, S., Brandt, M., and Fayad, I.: FORMS: Forest Multiple Source height, wood volume, and biomass maps in France at 10 to 30 m resolution based on Sentinel-1, Sentinel-2, and Global Ecosystem Dynamics Investigation (GEDI) data with a deep learning approach, Earth Syst. Sci. Data, 15, 4927–4945, https://doi.org/10.5194/essd-15-4927-2023, 2023.
Activités :
Les principales activités seront les suivantes:
• Concevoir et encadrer le développement de chaînes de traitement basées sur le deep learning pour la cartographie des forêts à partir d'images satellitaires multi-capteurs (optique, radar, LiDAR) ;
• Piloter l'intégration de nouveaux capteurs spatiaux (ex. ALOS PALSAR, BIOMASS, NISAR) dans les pipelines existants, en étroite collaboration avec les chercheurs et partenaires techniques ;
• Définir et mettre en œuvre des protocoles de validation et d'évaluation des modèles développés sur des bases de données de référence, en lien avec les objectifs scientifiques du laboratoire ;
• Superviser le déploiement des outils sur des plateformes de calcul intensif (HPC) comme Jean Zay, en optimisant les performances (temps de calcul, mémoire, parallélisation) ;
• Coordonner le travail d'ingénierie logicielle autour des outils GEEFetch et SPROUT, en garantissant leur robustesse, leur documentation et leur maintenance dans le temps ;
• Assurer une veille scientifique et technologique dans les domaines du deep learning appliqué à la télédétection et participer à la diffusion des résultats (publications, communications, outils partagés) ;
• Accompagner les utilisateurs internes et externes dans l'appropriation des outils développés (supports, formations, rédaction de guides).
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.