Vos missions en quelques mots Les principales filières technologiques sont les suivantes : Développement d’applications web avec Typescript / Angular, Python / Django et PostgreSQL Développement de solutions data et IA avec Python / Streamlit et une plateforme data Intégration et déploiement continus avec Gitlab-CI, Ansible et Docker. Le département collabore étroitement avec le département de l’exploitation et de l’infrastructure sur les aspects DevSecOps, et avec les départements projets et d’assistance à la maîtrise d’ouvrage dans des démarches projet classiques ou agiles. Dans un souci d’amélioration continue, le département impulse et participe à des innovations internes pour accroitre son efficience technique : intégration d’OpenTelemetry, acculturation à Kubernetes, élaboration d’un assistant IA spécialisé dans le code, etc. Vous développerez des solutions data dans un écosystème technologique s’appuyant sur le langage Python, une plateforme de traitement de données permettant de collecter, transformer, mettre en qualité et analyser des données, et une plateforme d’IA générative interne. Vos missions sont les suivantes : Conception, développement et documentation d’applications de collecte, de traitement et de visualisation de données Conception, maintenance et optimisation de pipelines d'entraînement et de déploiement de modèle d'IA, en assurant l'automatisation, la traçabilité, la sécurité, la conformité et la collaboration avec les Data Scientists pour transformer les prototypes en produits utilisables Indexation du corpus documentaire interne selon une approche RAG (Retrieval Augmented Generation) en s’appuyant sur des modèles de langages ouverts et hébergés en interne ou sur la plateforme Albert de la DINUM, selon les exigences de confidentialité Collaboration étroite avec les développeurs, les exploitants ainsi que les data scientists et les experts métier utilisateurs de la plateforme de données Innovation : étudier et prototyper des usages d’IA prédictive et générative dans un but d’amélioration de l’efficacité et de la productivité des équipes de contrôle. Vos missions sont supervisées un ingénieur data senior, en charge de la plateforme de données de la Cour. Environnement technologique Python / Streamlit / LangChain (ou équivalent) : développement web et pipelines data et IA MLFlow : plateforme de gestion de cycle de vie des projets de machine learning Apache Superset : plateforme de dataviz Apache Airflow : orchestration des tâches Apache Spark : traitements de données distribuées Apache Nifi : acheminement et traitement de données Trino : moteur de requête ElasticSearch : indexation des données PostgreSQL : base de données relationnelle Stockage objet S3 / CephFS JupyterHub : notebooks Python et R Gitlab : chaines CI/CD Docker et Kubernetes Profil recherché Expérience antérieure souhaitée : Une expérience antérieure de 2 ans sur un poste similaire serait appréciée ainsi qu'un profil d’ingénieur data de niveau bac5. Compétences requises : Maîtrise du langage de programmation Python Maîtrise de bases de données SQL (PostgreSQL) et d’ElasticSearch Connaissances en RAG (chunking, calcul d’embeddings, reranking, etc.) Connaissances en Machine Learning (apprentissage et inférence) Aisance avec des environnements Linux et Docker Expérience avec Apache Airflow et Apache Superset Qualités nécessaires : Autonomie et aptitude au travail en équipe Capacité à analyser et résoudre efficacement Bonnes capacités de communication Apprentissage continu et curiosité intellectuelle Localisation Localisation : 13 Rue Cambon, 75001 Paris, France Flèche gauche : déplacer la carte vers la gauche Flèche droite : déplacer la carte vers la droite Flèche bas : déplacer la carte vers le bas Flèche haut : déplacer la carte vers le haut
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.