Informations générales Organisme de rattachement Institut National de Recherche pour l'Agriculture, l'Alimentation et l'Environnement (INRAE) Référence INRAE-OT-28777 Date de début de diffusion 04/03/2026 Date de parution 12/03/2026 Date de fin de diffusion 15/03/2026 Versant Fonction Publique de l'Etat Catégorie Catégorie A (cadre) Nature de l'emploi Emploi ouvert uniquement aux contractuels Domaine / Métier Recherche - Experte / Expert en production, traitement et analyse de données Statut du poste Vacant Intitulé du poste Ingénieur·e d’étude Data / Machine Learning Descriptif de l'employeur L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France.INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes. Description du poste ContexteL’environnement alimentaire, social et urbain est aujourd’hui considéré comme un facteur influençant les comportements alimentaires1. Les acteurs des territoires pourraient donc agir sur l’environnement pour encourager des comportements alimentaires durables et favorables à la santé, en améliorant l’accessibilité à l’ensemble de l’offre alimentaire (commerces, restaurants, marchés, points de vente). Cependant, en France, il n’existe à l’heure actuelle aucune base de données fiable disponible à l’échelle nationale permettant de caractériser et spatialiser finement l’environnement alimentaire2.Un premier travail a été conduit visant à agréger des données issues de différentes sources de données en prenant comme point de départ le répertoire des entreprises Sirene3. Ces données ont pu être agrégées grâce à l’utilisation dans ces bases d’un identifiant unique : le numéro Siret des entreprises. Cependant, ce travail est aujourd’hui incomplet : par exemple de nombreux établissements fermés sont considérés actifs dans cette base. De plus, des caractéristiques et des coordonnées géographiques plus précises sont renseignées dans d’autres bases existantes mais n’utilisant pas le numéro Siret comme identifiant. C’est notamment le cas de la carte collaborative OpenStreetMap. Enfin, certaines formes de distribution alimentaires comme les marchés, les points de distribution des AMAP ne sont pas renseignées dans le répertoire Sirene.Le projet soulève des enjeux méthodologiques forts en data engineering, en apprentissage automatique et en analyse spatiale : intégration de sources hétérogènes, désambiguïsation d’entités, détection d’erreurs et d’obsolescence, gestion de l’incertitude spatiale. Il vise à produire une base de données réutilisable à long terme, tant pour la recherche que pour l’action publique.1 https://openknowledge.fao.org/server/api/core/bitstreams/4ac1286e-eef3-4f1d-b5bd-d92f5d1ce738/content2 https://onlinelibrary.wiley.com/doi/full/10.1111/tgis.130133 https://www.sciencedirect.com/science/article/pii/S235234092500575X Descriptif du profil recherché ‐ Niveau d’étude et type de formation : Bac 5 en école d'ingénieurs, université ou équivalent avec une spécialisation en Data Science, Mathématiques Appliquées ou Informatique‐ Très bonne maîtrise de Python ou R pour la data science et le machine learning‐ Solide expérience en data engineering : pipelines reproductibles, gestion de données hétérogènes, SQL‐ Expérience concrète en machine learning supervisé appliqué à des données réelles et imparfaites‐ Intérêt marqué pour :la qualité des donnéesle record linkage / entity resolution‐ La maîtrise de PostGIS ou de techniques d’OCR constitue un atout fort‐ Aptitude à travailler de façon itérative et utilisant un système de versionnement de code (Git) Localisation du poste Europe, France, Occitanie Géolocalisation du poste 34000 Montpellier Lieu d'affectation (sans géolocalisation) 34000 Montpellier Critères candidat Niveau d'études / Diplôme Niveau 6 Licence/diplômes équivalents Date de vacance de l'emploi 04/05/2026
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.