About the role
Rejoignez une équipe passionnée où vous pourrez transformer les données conversationnelles en solutions innovantes qui façonnent l'avenir des interactions clients.
Votre Mission
Vous participez aux projets de l’entité en adaptant des grands modèles de langues à des domaines spécifiques, à des tâches particulières ou à une langue afin de les optimiser (poids, empreinte carbone, contexte et capacité d'inférence on-premise/cloud/edge/device, etc.) et les rendre plus performants en fonction des exigences des uses-cases cibles.
Vos activités
Le fine-tuning des modèles LLMs peut se faire à différents niveaux : continual pre-training, instruction tuning, reinforcement learning.
1. Vous concevez et créez des corpus spécifiques adaptés à chaque type de fine-tuning en mettant en œuvre des méthodes de curation de données pour en assurer la qualité.
2. Vous configurez les hyper-paramètres, lancez les processus de fine-tuning et surveillez les métriques de performance pour garantir la performance des modèles.
Les modèles fine-tunés doivent être ensuite évalués précisément :
3. Vous concevez et créez des corpus d’évaluation en lien avec les cas d’usage métier
4. Vous procédez aux évaluations des modèles fine-tunés
5. Vous analysez les résultats obtenus afin d’identifier les forces et faiblesses des modèles, orienter la conception de corpus supplémentaires et déterminer les niveaux de fine-tuning à privilégier et réitérez.
Pour certains use-cases, vous aurez pour challenge de développer des corpus adaptés pour le fine-tuning à partir de ressources rares.
Vous pourrez être amené à contribuer plus largement à des travaux de développement d’outils.
Vous travaillez en coopération avec les équipes métiers des pays afin de comprendre leurs besoins/spécifications et d’identifier les méthodologies et solutions qui contribuent à les satisfaire.
Vous mettez en œuvre les différentes techniques de data science, en vue de fournir des modèles utilisables en production.
about you
Vous aimez les challenges et vous vous adaptez facilement dans un domaine qui évolue très rapidement.
Vos hard skills
6. De profil data scientist, avec de l'expérience NLP et des compétences en développement dans un contexte de Delivery
7. Maitrise des librairies Python pour le Machine Learning (pandas, scikit-learn, numpy, etc.)
8. Connaissance des plateformes HuggingFace, Docker, PyTorch et des logiciels SLURM et High Performance Computing (HPC)
9. Connaissance du processus Machine Learning Operations (MLOps)
10. Une expérience en Fine tuning de BERT et/ou de LLM serait un plus
Vous êtes diplômé.e d'une école d'ingénieur ou diplôme équivalent de niveau master 2.
Vous savez faire preuve de hauteur de vue dans l’analyse des besoins et la résolution de problèmes métiers. Vous avez des capacités de communication (écrit, oral) en français et anglais.
Nous recherchons une personne curieuse, capable de travailler en équipe, avec un bon sens de la communication. Vous devez faire preuve d'autonomie et d'initiative, tout en étant adaptable face aux défis. Une passion pour l'innovation et l'apprentissage continu est essentielle.
additional information
Rejoignez une équipe innovante dédiée à la recherche et au développement, en partenariat avec des leaders du secteur de l'intelligence artificielle. Vous aurez l'opportunité d’échanger avec des experts, de partager des idées et de contribuer à des projets qui façonnent l’avenir de la technologie.
Vous évoluerez dans un environnement stimulant, au sein d’une équipe aux profils complémentaires, favorisant l’échange et l’innovation.
Ceci dans un cadre de travail offrant une bonne qualité de vie, propice à l'épanouissement personnel et professionnel, au sein d'un site regroupant 1000 collaborateurs.
Vous pourrez travailler sur des projets à la pointe de la technologie, avec un accès aux dernières avancées en IA et data science, tout en étant accompagné par des mentors expérimentés prêts à vous guider dans votre parcours.
department
La direction Data & IA, au sein de l’entité Orange Innovation, a pour ambition de développer l’usage de la Data et de l’Intelligence Artificielle, en étroite collaboration avec les pays sur leurs cas d’usages et leurs besoins métier, tout en maintenant son niveau d’expertise élevé grâce à la recherche.
En tant que Data Scientist au sein de l'équipe « Natural Dialogue Interaction », vous intégrerez une équipe pluridisciplinaire composée d'une vingtaine de chercheurs, data scientists, ingénieurs logiciels et doctorants. Cette équipe dynamique a pour missions principales de :
1. Développer des outils d’analyse et d’amélioration continue, notamment dans le domaine des bots et assimilés, en exploitant les dernières technologies et modèles d'IA générative.
2. Accompagner en expertise les équipes métiers en France et à l'international dans l'analyse de données textuelles et conversationnelles, répondant ainsi aux besoins d'Orange et de nos clients externes.
3. Inventer les systèmes conversationnels de demain dans le cadre de projets de recherche et d’exploration visant à améliorer l'expérience des clients et des collaborateurs.
contract
Regular
Hybrid work
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.