Emploi
J'estime mon salaire
Mon CV
Mes offres
Mes alertes
Se connecter
Trouver un emploi
TYPE DE CONTRAT
Emploi CDI/CDD
Missions d'intérim Offres d'alternance
Astuces emploi Fiches entreprises Fiches métiers
Rechercher

Apprentissage par renforcement pour une ia agentique fiable - stage h/f

Courbevoie
Alternance
Stage
Assystem
Publiée le 22 octobre
Description de l'offre

Description du poste


Nous recherchons un(e) stagiaire pour participer à la mise en place d’IA agentique sure et efficace pour des workflows d’ingénierie en contexte réglementé nucléaire. Vous appliquerez l’apprentissage par renforcement (RL) – associé à des garde fous solides à une évaluation rigoureuse – pour permettre à un agent LLM de planifier, d’utiliser les outils et de vérifier les résultats sur une infrastructure cloud et sur site.

Vous travaillerez main dans la main avec notre référent technique LLM pour appliquer des méthodes de RL de pointe (optimisation des préférences (DPO/IPO), bandits, RL hors ligne) à des cas d’usages concrets à destination des équipes d’ingénierie - tout en répondant aux attentes du secteur en matière de sécurité et de conformité.

Missions principales:

* Construire une boucle d’agents (planning → appels outils → vérification) avec garde-fous.
* Récompenses multi objectifs multi-objective rewards prenant en compte également latence, coût..
* Construire un pipeline preference/feedback RLHF/RLAIF.
* Explorer différentes méthodes RL : preference optimization (DPO/IPO), bandits;
* Sécuriser le pipeline: règles, provenance tracking, confidence, human-in-the-loop approvals.
* Appliquer à la réalisation d’un assistant pilote agentique démontrant un gain de temps sur des cas d’usage réels.



Pourquoi réaliser votre stage chez Assystem ? On a 3 bonnes raisons pour vous convaincre !

Travailler au sein d’une équipe engagée qui ramène expertise et croissants le matin !

Découvrir pourquoi 92% de nos stagiaires apprécient l’ambiance et leur environnement de travail

Gagner en compétences et développer votre expertise métier en échangeant au quotidien avec les collaborateurs Assystem, ainsi que le client en direct pour plus de proximité !


Qualifications


Niveau de formation :
Étudiant en BAC+5 (Master, école d’ingénieur ou équivalent).
Un niveau BAC+4 pourra être envisagé pour un(e) candidat(e) particulièrement motivé(e).

Domaine de spécialisation :
Informatique, Intelligence Artificielle, ou Mathématiques appliquées.

Compétences techniques :

* Solide maîtrise de Python, avec une expérience sur PyTorch (ou TensorFlow).

* Intérêt marqué pour l’apprentissage par renforcement (reward design, bandits, policy/preference optimization).

* Intérêt pour les LLMs et les agents intelligents ; une expérience avec LangChain, LangGraph ou outils similaires est un plus.

* Bonne compréhension des bonnes pratiques de développement : tests, reproductibilité, suivi des expériences (experiment tracking).

* Familiarité avec Git et Docker.

Compétences transverses :
Curiosité, rigueur, autonomie, esprit d’initiative, sens de la collaboration, et anglais opérationnel.



Informations supplémentaires


Nous nous engageons au respect de l’égalité de traitement entre les candidats, et célébrons toutes les formes de diversité. Chez Assystem, seules les compétences comptent ! Si vous souhaitez porter à la connaissance d’Assystem une quelconque situation ou des besoins spécifiques, n’hésitez pas vous serez accompagné(e) !

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder
Offre similaire
Ingénieur génie civil - dynamique rapide - stage h/f
Courbevoie
Stage
Assystem
Ingénieur génie civil
Offre similaire
Digitalisation des processus métiers du nucléaire avec iterop - stage h/f
Courbevoie
Stage
Assystem
R&D
Offre similaire
Ingénieur génie civil – séisme iss - stage h/f
Courbevoie
Stage
Assystem
Ingénieur génie civil
Voir plus d'offres d'emploi
Estimer mon salaire
JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.

Offres similaires
Recrutement Assystem
Emploi Assystem à Courbevoie
Emploi Courbevoie
Emploi Hauts-de-Seine
Emploi Ile-de-France
Assystem Intérim
Intérim Assystem à Courbevoie
Intérim Courbevoie
Intérim Hauts-de-Seine
Intérim Ile-de-France
Accueil > Emploi > Apprentissage par renforcement pour une IA agentique fiable - Stage H/F

Jobijoba

  • Conseils emploi
  • Avis Entreprise

Trouvez des offres

  • Emplois par métier
  • Emplois par secteur
  • Emplois par société
  • Emplois par localité
  • Emplois par mots clés
  • Missions Intérim
  • Emploi Alternance

Contact / Partenariats

  • Contactez-nous
  • Publiez vos offres sur Jobijoba
  • Programme d'affiliation

Suivez Jobijoba sur  Linkedin

Mentions légales - Conditions générales d'utilisation - Politique de confidentialité - Gérer mes cookies - Accessibilité : Non conforme

© 2025 Jobijoba - Tous Droits Réservés

Les informations recueillies dans ce formulaire font l’objet d’un traitement informatique destiné à Jobijoba SA. Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous disposez d’un droit d’accès et de rectification aux informations qui vous concernent. Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant. Pour en savoir plus, consultez vos droits sur le site de la CNIL.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder