Chez Framatome, filiale d'EDF, nous concevons et fournissons des équipements, des services, du combustible, et des systèmes de contrôle-commande pour les centrales nucléaires du monde entier.
Nos 20 000 collaborateurs permettent chaque jour à nos clients de produire un mix énergétique bas-carbone toujours plus propre, plus sûr et plus économique.
Nos équipes développent également des solutions pour les secteurs de la défense, de la médecine nucléaire et du spatial.
Implantée dans une vingtaine de pays, Framatome rassemble les expertises d'hommes et de femmes passionnés et convaincus que le nucléaire est une énergie d'avenir.
Entreprise responsable, nous développons des actions pour former et accompagner les premières expériences professionnelles (label Happy Trainees), intégrer tous les talents, dont les personnes en situation de handicap, oeuvrer pour l'égalité professionnelle et la mixité de nos métiers (94/100 à l'index de l'égalité hommes-femmes) et concilier les temps de vie.
Pour suivre notre actualité, retrouvez-nous sur www.framatome.com, LinkedIn, Instagram et X. Contexte
Au sein du département DTIPC-F (études neutroniques), vous rejoindrez une équipe de R&D spécialisée en automatique et en intelligence artificielle appliquées au pilotage de systèmes complexes.
Le stage s'inscrit dans le cadre du développement d'une méthode d'apprentissage en temps réel (online learning) visant à améliorer la précision des méthodes de commande prédictive d'un réacteur nucléaire.
Ce travail, à l'interface entre machine learning et ingénierie nucléaire, a un impact direct sur la sûreté et la performance des installations.
Lors de la mise en oeuvre d'un algorithme de commande prédictive en temps réel, un écart persistant apparaît entre :
le modèle de simulation théorique,
et le comportement physique réel du réacteur.
Cet écart, variable dans le temps et spécifique à chaque installation, peut être estimé grâce aux données d'exploitation.
L'objectif est donc de concevoir un modèle statistique adaptatif capable de corriger cet écart en ligne.
Objectifs du stage
Réaliser un état de l'art des méthodes d'apprentissage statistique en ligne.
Concevoir un modèle adaptatif capable de corriger en temps réel l'erreur de prédiction/simulation.
Évaluer différentes familles de modèles de séries temporelles (réseaux de neurones, méthodes ensemblistes, régressions avancées), selon : performance quantitative, complexité et explicabilité.
Implémenter et entraîner les modèles, constituer un jeu de données représentatif, comparer les approches retenues.
Analyser la Sample Complexity : obtenir des garanties théoriques sur le nombre minimal de données nécessaires pour apprendre la fonction cible.
(Optionnel) Intégrer des stratégies d'active learning pour recaler le modèle en fonction des variations physiques réelles.
(Optionnel) Définir une stratégie de contrôle optimal basée sur le modèle corrigé (physique + ML).
(Si l'avancée le permet) Explorer des approches de contrôle autonome en temps réel (Active Reinforcement Learning).
Mots-clés
Statistical Learning
Active Learning
Time Series Forecasting
Physics-Informed Neural Networks (PINN)
Optimal Control
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.