Vos missions au quotidien
Société Générale Assurances, compagnie d'assurance du Groupe Société Générale, recherche un stagiaire Data Scientist pour travailler au sein du pôle IA du DataLab. Cette direction (13 personnes) réalise des études statistiques à haute valeur ajoutée auprès d’interlocuteurs variés (autres directions, filiales, distributeurs…). La direction développe également des solutions d’Intelligence Artificielle ayant pour but d’améliorer la connaissance client et l’efficacité opérationnelle des services de gestion de l’entreprise.
Quelques exemples de missions réalisées :
1) Participation à la construction et déploiement de solutions d’IA (NLP, IA Générative, Computer vision et Speech Analytics) pour optimiser les processus dans différents services de gestion : analyse automatique des verbatims clients, catégorisation automatique d’emails, extraction d’informations depuis des documents scannés, analyse du contenu audio des appels téléphoniques, ...)
2) Travaux R&D : transparence des algorithmes d’IA, application des LLM, travaux avec l’actuariat autour de l’utilisation de nouvelles données pour la tarification (analyse des données télématiques, données météo, modélisation de la probabilité de retard des vols, ...)
Votre rôle
Le stage consistera à explorer et à enrichir les solutions existantes du datalab en combinant les avancées récentes en IA Générative, NLP et technologies de graphes. Vous serez amené(e) à travailler sur :
· Expérimentation d’approches avancées de Retrieval Augmented Generation (RAG), incluant la variante Graph RAG, afin d’améliorer la pertinence des réponses en exploitant des connaissances structurées sous forme de graphes (relations, entités, contextes métier).
· Mise en œuvre de techniques de NLP-clustering (regroupement automatique de textes, segmentation de corpus, détection de thématiques ou de tendances) pour l’analyse de grands volumes de textes divers.
· Test et comparaison de différents modèles et frameworks liés à l’IA Générative, au NLP et aux graphes.
· Participation à l’optimisation des performances (temps d’inférence, scalabilité, qualité des clusters ou des réponses générées) et à l’intégration des modèles dans des APIs ou des workflows batch.
· Construction d’une librairie interne pour garantir la réutilisabilité et la mutualisation des travaux dans les différents projets du datalab.
· Documentation des travaux réalisés et contribution à la veille technologique sur les thématiques innovantes du laboratoire.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.