Contexte et atouts du poste
Nous recherchons un ingénieur de recherche en CDD pour venir optimiser les travaux de thèse (débutée en septembre 2024) en traitement automatique de données bathymétriques par des méthodes d'apprentissage profond.
Le Shom (Service hydrographique et océanographique de la Marine) est l’opérateur public pour l’information géographique maritime et littorale de référence ( Dans le cadre de ses missions, il réalise des campagnes à la mer afin d’acquérir le maximum d’informations précises de la bathymétrie (profondeurs d’eau) sur les zones d’intérêt qui lui sont assignées. Ces données, sous forme de nuages de points geospatiaux, sont actuellement traitées manuellement afin d’extraire le signal utile avant d’être intégrées en base de données et de vernir renseigner les produits cartographiques utiliser afin d’assurer la sécurité de la navigation en mer. Les étapes de traitement et de contrôle de l’information bathymétrique, du nettoyage des mesures aberrantes et d’intégration en base de données, dure en moyenne un an et demi.
La présente collaboration de recherche entre Shom, INRIA et IMT a pour objectif de mettre en place une chaîne de traitement automatique ou semi-automatique d’extraction de l’information utile au sein de nuages de points bathymétriques (acquis par Lidar ou sondeur multifaisceaux). Les gains de temps attendus ne devront pas occulter les besoins d’explicabilité et de fiabilité.
La démarche scientifique entamée consiste à tirer parti des méthodes d’IA par apprentissage profond appliquées aux nuages de données géospatiales de bathymétrie. La thèse en cours élabore l’approche méthodologique et propose des preuves de concepts. L’ingénieur de recherche participera à leur passage à l’échelle, à leur évaluation, et le cas échéant à leur opérationnalisation (mise à disposition vers les opérateurs), en prenant soin de de fournir un protocole détaillé et chiffré, en matière de complexité algorithmique, volume, stockage, architecture, des différentes opérations nécessaires tout au long du cycle de vie du système IA proposé, depuis le recueil de la donnée jusqu’à l’affichage des résultats à l’opérateur.
Mission confiée
Le programme de travail de la thèse se divise en 3 axes :
1. Elaboration d’un ensemble de descripteurs à partir de données SMF et LIDAR ;
2. Conception d’architectures d’apprentissage automatique par régression pour la prévision du fond marin à partir des descripteurs ;
3. Approche portfolio et explicable pour une aide à la décision de l’hydrographe.
Comme indiqué précédemment, l'ingénieur viendra en appui de cette thèse. Son rôle sera :
4. d'affiner les modèles et les descripteurs conçus par le doctorant ;
5. de gérer le passage à l'échelle dans la structuration de la donnée et dans l'entraînement des modèles ;
6. de transformer le code en un prototype fonctionnant dans son environnement de destination et intégré aux outils du Shom :
7. de mettre en place l'évaluation du prototype par les opérateurs du Shom et de prendre en compte les retours utilisateur.
Principales activités
Dans l’axe 1, l’ingénieur aidera à :
8. Affiner la définition et le calcul des descripteurs pertinents et explicables caractérisant les données géospatiales LIDAR. Plusieurs classes de descripteurs seront considérées : des quantités statistiques ou fonctionnelles, des dictionnaires à base de partitionnement, enfin des méthodes neuronales.
9. Favoriser un passage à l’échelle (structuration de la donnée / parallélisation) dans le calcul de ces descripteurs sur des larges volumes de données (plusieurs millions voire des dizaines de millions de points), puis sur des ensembles de zones.
Dans l’axe 2, le but sera d’optimiser les preuves de concepts des modèles prédictifs proposées dans le cadre de la thèse. Dans ce cadre L’ingénieur devra :
10. Industrialiser ces architectures, optimiser les réglages fins des hyperparamètres, structurer les protocoles d’expérimentation/validation.
Dans l’axe 3, alors que les travaux de thèse viseront à sélectionner le meilleur modèle prédictif à utiliser en fonction des caractéristiques intrinsèques des données et l’exploitation attendue de l’information bathymétrique générée et des capacités explicatives du modèle, les travaux de l’ingénieur viseront à :
11. Intégrer les développements et permettre une validation en aval par les opérateurs en conditions réelles de traitement.
12. Prendre l’initiative dans l’élaboration et la mise en place de protocoles d’évaluation des outils par les opérateurs, ainsi qu’au dépouillement et à l’analyse des résultats obtenus et des retours d’expérience.
Compétences
Compétences techniques et niveau requis :
13. de solides bases en apprentissage automatique et en apprentissage profond ;
14. une bonne maîtrise du langage Python et des bibliothèques Sklearn, PyTorch et TensorFlow ;
15. une expérience réelle de mise en place de chaînes MLOps ;
16. des connaissances en traitement de données géospatiales (notamment nuages de points) seraient un plus ;
17. optionnel : une maîtrise des bibliothèques de traitement de données volumineuses comme Dask, Xarray ou Zarr.
Langues : francais ou anglais
Compétences relationnelles : être capable de discuter à la fois avec les experts en apprentissage profond et avec les opérateurs sur le terrain ; être capable de collaborer étroitement avec le doctorant tout au long du projet, avec un partage clair des tâches.
Avantages
18. Restauration subventionnée
19. Transports publics remboursés partiellement
20. Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
21. Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
22. Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
23. Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
24. Accès à la formation professionnelle
25. Sécurité sociale
Rémunération
Selon grille de rémunération des agents contractuels de la fonction publique
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.