Contexte du poste :
Dans le cadre de l’accélération de l’intelligence artificielle au sein d'une banque commerciale, nous recherchons un(e) ingénieur(e) data spécialisé(e) en traitement de documents pour une mission sur site à Nantes.
Ce projet s'inscrit dans un chantier stratégique de Knowledge Management (KM) visant à créer une base de connaissance centralisée, à partir de documents non structurés (PDF, Word, HTML). L’objectif est de formaliser la connaissance de manière standardisée et réutilisable à long terme, indépendamment des cas d’usage spécifiques.
Objectif de la mission
Concevoir un pipeline complet d’extraction, de nettoyage et de structuration de contenus textuels issus de documents hétérogènes, afin de les organiser dans un format pivot enrichi (Markdown ou JSON).
Vos principales activités
* Extraction du texte depuis des fichiers PDF, Word, HTML via des librairies adaptées.
* Nettoyage et normalisation des contenus (suppression de bruit, traitements OCR si nécessaire).
* Segmentation des textes en unités de connaissance structurées (sections, blocs thématiques...).
* Enrichissement des unités avec des métadonnées : source, date, typologie, thématique.
* Conception et documentation d’un format pivot standardisé (Markdown enrichi ou JSON).
* Rédaction d’une documentation claire des choix de structuration et du format utilisé.
* Collaboration étroite avec l’équipe Knowledge Management pour affiner les modèles de structuration.
* Mise en place d’un pipeline automatisé réutilisable pour le traitement de nouveaux documents.
Compétences techniques requises
* Très bonne maîtrise du traitement de documents non structurés : parsing, OCR, nettoyage de texte.
* Solide expérience en NLP (Natural Language Processing) et structuration de texte.
* Connaissance des outils et bibliothèques Python : pdfminer, python-docx, BeautifulSoup, spaCy, Tesseract, etc.
* Maîtrise de la conception de pipelines de traitement automatisés.
* Rigueur dans la documentation et la standardisation des livrables.
* Excellentes capacités d’analyse, de structuration et d’autonomie.
* Vous avez un diplôme d'ingénieur, ou diplôme bac + 5 équivalent
* Vous avez au minimum de 3 ans d'expérience dans l'informatique.
Bonus :
* Connaissance de la plateforme Domino Data Lab.
Ce que nous offrons
* Une mission stratégique au sein d’un grand groupe bancaire innovant.
* Un projet à fort impact autour de l’intelligence artificielle et de la gestion de connaissance.
* Environnement stimulant, en lien direct avec les équipes métier et data.
* Cadre de travail à Nantes, avec possible flexibilité sur le rythme.
Descriptif de l’entreprise :
Meritis est un cabinet de conseil, pilotage et développement IT fondé en 2007 présent à Paris, Sophia-Antipolis, Aix-en-Provence, Montpellier, Toulouse, Nantes... Et bientôt sur de nouveaux territoires ! Notre mission ? Connecter les meilleurs talents aux entreprises pour leur donner un temps d’avance.
Nous accompagnons nos clients dans l’intégralité de leurs besoins en transformation numérique à travers de nombreux domaines d’expertises : Software Engineering, Finance, Pilotage de projets, Devops, Data, Cloud, Cybersécurité ou encore Agilité.
Intervenant aussi bien dans les secteurs de la Banque, de l'Assurance, des Télécommunications que de l'Industrie ou des Transports, aujourd'hui 40% des entreprises du CAC40 sont clientes Meritis.
Fort de nos valeurs d’exigence, d’humilité, de bienveillance et de proximité, nous comptons aujourd’hui plus de 900 collaborateurs.
Nous mettons un point d’honneur à être proche de nos collaborateurs et à les accompagner de manière individualisée quelles que soient leurs fonctions dans l’entreprise. Certifiée Great Place To Work depuis 2013, notre conception du bien-être au travail va bien au-delà d'un simple label, ce sont nos collaborateurs qui en parlent le mieux : https://www.glassdoor.fr/Avis/Meritis-Avis-E1163008.htm.
Devenir collaborateur Meritis c’est :
· Des parcours professionnels sur mesure (évolution de carrière, formations adaptées, mentoring…)
· Avoir le choix de sa mission et un accompagnement personnalisé tout au long de votre carrière ;
· Evoluer dans un environnement où l’apprentissage est favorisé : formations certifiantes, e-learning, meetUp, concours de code, parcours d’évolutions etc ;
· Faire partie de communautés d’experts qui partagent leurs savoirs et expériences au sein de nos centres de compétences ;
· Un environnement convivial avec de nombreux événements festifs (soirée annuelle, séminaires & teambuiding, déjeuners et afterworks…) ;
Vos différences sont nos atouts. C’est pourquoi Meritis est engagée en faveur de la diversité et de la non-discrimination. Tous nos métiers sont accessibles aux personnes en situation de handicap. Si vous avez une question ou pensez être victime ou témoin d’une discrimination, vous pouvez contacter ethiquegroup@meritis.fr. »
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.