Vous exercerez votre activité au sein de l'infrastructure scientifique collective GENTYANE, dirigée par Charles Poncet. La plateforme propose des services en génomique, en particulier du génotypage et du séquençage courts et longs fragments. Au quotidien, vous travaillez en étroite collaboration avec les personnels de GENTYANE, ses clients et la plateforme Bioinformatique du GDEC dirigée par Pauline Lasserre-Zuber. Vous devrez également interagir avec le personnel du Mésocentre de l'Université Clermont-Auvergne (UCA) qui héberge et administre notre infrastructure de stockage et de calculs. Vous serez encadré.e directement par Véronique Gautier (Ingénieure d'Etude).
Contexte de travail :
La plateforme Gentyane propose une offre de service de séquençage "long-reads" avec les technologies développées par Pacific Biosciences (Revio) et par Oxford Nanopore Technologies (Promethion 2), ainsi qu'une offre de séquençage "short reads" avec le séquenceur Aviti d'Element Biosciences actuellement en production.
Votre mission consistera à assurer le traitement bio-informatique des données issues de ces technologies et de délivrer les données traitées aux clients.
Vous serez également amené.e à travailler sur les données de génotypage produites sur la plateforme.
Vous assurerez la maintenance des serveurs (mises en réseau, mises à jour, débogage), ce qui nécessitera d'interagir avec les supports techniques des fournisseurs (PacBio, ONT et Element Biosciences) et les supports informatiques internes à INRAE et l'UCA.
Vous serez plus particulièrement en charge de :
1. Mettre en œuvre des méthodes bioinformatiques, notamment des méthodes de calculs distribués et de parallélisation sur les données afin de traiter des volumes massifs de données.
2. Assurer le stockage et le traitement bioinformatique des données issues des séquenceurs ADN et délivrer les données traitées aux clients.
3. Mettre en œuvre des techniques informatiques pour optimiser la programmation et l'accès aux données.
4. Mener une veille technologique régulière, en particulier sur les technologies long-reads, via la consultation de publications scientifiques, les séminaires scientifiques et technologiques de la communauté clermontoise, la surveillance de dépôts GitHub et de forums bio-informatiques/informatiques spécialisés, l'analyse des retours d'expérience d'utilisateurs.
5. Elaborer des stratégies d'analyse bioinformatique et des développements de pipelines pour traiter les données de séquençage selon les besoins du client en intégrant des gestionnaires d'outils, de workflow, et des conteneurs d'environnements (Conda, Snakemake, Singularity).
6. Développer des étapes complémentaires de pipelines en langages de programmation Python, bash et R.
7. Installer des outils bio-informatiques existants et les adapter aux caractéristiques du cluster de calcul du Mésocentre UCA.
8. Assurer la maintenance des serveurs (mises en réseau, mises à jour, débogage), ce qui nécessitera d'interagir avec les supports techniques des fournisseurs (PacBio, ONT et Element Biosciences) et les supports informatiques internes à INRAE et l'UCA.
9. Appliquer les principes FAIR, en intégrant notamment des gestionnaires d'outils (Conda), de workflow (Snakemake, Nextflow), et des conteneurs d'environnements (Docker, Singularity) dans les pipelines et en maintenant un dépôt de scripts Gitlab.
Date de prise de fonction souhaitée au 01/08/2025.
Le site de Crouël est directement desservi par les lignes de bus régulières T2C n°9, n°35 et n°36.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.