Emploi
J'estime mon salaire
Mon CV
Mes offres
Mes alertes
Se connecter
Trouver un emploi
TYPE DE CONTRAT
Emploi CDI/CDD
Missions d'intérim Offres d'alternance
Astuces emploi Fiches entreprises Fiches métiers
Rechercher

Apprentissage automatique pour l'analyse guidée des spectres de laboratoire afin d'étudier les molécules précurseurs de la vie dans l'espace // machine learning for guided analysis of laboratory spectra to study life-precursor molecules in space

Toulouse
Alternance
Université de Toulouse
Publiée le 27 juillet
Description de l'offre

Topic description

En tirant parti de l'apprentissage automatique pour rationaliser et accélérer l'analyse spectrale des spectres de laboratoire, ce projet doctoral vise à améliorer notre compréhension de la complexité moléculaire présente dans le milieu interstellaire (MIS). L'objectif est de fournir des informations essentielles sur les origines des molécules prébiotiques, qui sont cruciales pour comprendre les origines de la vie. La radioastronomie a joué un rôle essentiel dans l'identification d'un large éventail de molécules organiques complexes dans le MIS. Les spectres radio-astronomiques des régions de formation d'étoiles contiennent des milliers de raies qui se chevauchent, dont certaines ont été identifiées tandis que d'autres restent énigmatiques. Les principales molécules organiques identifiées dans le MIS sont : le formaldéhyde, le méthanol, une variété de molécules organiques complexes (MOC), le glycolaldéhyde et le glycolamide. Les molécules trouvées dans le MIS peuvent contribuer à l'inventaire chimique des planètes en formation. La glycine a été identifiée dans des comètes, de même que le ribose et d'autres sucres bio-essentiels comme l'arabinose et le xylose. Cela conduit à l'hypothèse que les molécules créées dans le MIS ont fourni des précurseurs essentiels à la vie sur la Terre au début de son histoire. Des processus similaires peuvent se produire sur des exoplanètes, ce qui augmente la probabilité de trouver de la vie ailleurs dans le cosmos.
Pour caractériser les spectres des radiotélescopes, il est essentiel de mesurer au préalable les spectres des molécules candidates en laboratoire. Cependant, l'application directe de ces mesures de laboratoire au MIS est compliquée par les conditions très différentes présentes dans l'espace, notamment la température, la pression et la densité. Une analyse mécanique quantique est donc nécessaire pour déterminer un ensemble de paramètres moléculaires permettant de prédire non seulement les fréquences des raies spectrales, mais aussi leurs intensités dans le MIS. Les spectres des MOC sont complexes en raison de plusieurs facteurs, notamment l'asymétrie moléculaire, la présence de nombreux états vibrationnels de faible énergie et les interactions entre les mouvements de torsion, de vibration et de rotation. Les techniques modernes de laboratoire permettent une mesure rapide des spectres, cependant l'analyse qui s'ensuit demande beaucoup de travail et requiert une expertise acquise. Bien que les logiciels nécessaires pour accompagner l'analyse soient disponibles, le processus implique de nombreuses tâches répétitives qui pourraient être considérablement accélérées par l'application de l'apprentissage automatique.
Le projet se concentrera sur l'automatisation du processus d'analyse spectrale en appliquant des modèles de séquence tels que les LSTM ou les Transformers pour identifier des motifs dans les données spectrales, classer les lignes spectrales et prédire leurs décalages par rapport aux valeurs théoriques. Les méthodes d'optimisation basées sur l'apprentissage (par exemple, bayésienne ou par renforcement) peuvent soutenir l'affinement itératif des paramètres moléculaires en minimisant la REQM. En outre, les techniques d'apprentissage non supervisé (par exemple, le regroupement, les auto-encodeurs) peuvent aider à reconnaître des structures dans des spectres complexes, en particulier en présence de lignes qui se chevauchent et de bruit. Le processus sera vérifié en utilisant une molécule comme l'anhydride formique ((HCO)2O)) pour laquelle l'analyse par des experts humains a déjà commencé, fournissant ainsi un point de référence pour guider et évaluer la procédure.
La thèse débutera par l'acquisition de l'expertise en analyse spectrale à Toulouse. Elle se poursuivra par l'application de l'apprentissage automatique à Cracovie, en Pologne. Elle sera ensuite finalisée par l'application de la technique à de nouvelles recherches de molécules potentiellement présentes dans le MIS.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

By leveraging machine learning to streamline and accelerate the spectral analysis of laboratory spectra, this doctoral project aims to enhance our understanding of the molecular complexity present in the interstellar medium (ISM). The aim is to provide critical insights into astrobiology and the origins of prebiotic molecules which are crucial for understanding the origins of life. The ISM is a vast and complex environment filled with gas and dust and radioastronomy has played a pivotal role in identifying a diverse array of complex organic molecules in this medium. The radio-astronomical spectra of star-forming regions, exhibit a rich tapestry of spectral lines, with thousands of overlapping lines, some of which have been identified while others remain enigmatic. Key organic molecules identified in the ISM include: Formaldehyde (H₂CO) Methanol (CH₃OH), a variety of Complex Organic Molecules (COM), Glycolaldehyde (HOCH2CHO) and Glycolamide (HOCH2CONH2). The molecules found in the ISM can contribute to the chemical inventory of forming planets. Glycine itself has been identified in comets as well as ribose and other bio-essential sugars including arabinose and xylose. This leads to the hypothesis that molecules created in the ISM delivered essential building blocks of life to Earth during its early history. Similar processes may occur on exoplanets, increasing the likelihood of finding life elsewhere in the cosmos.
To accurately characterize these spectra and identify the molecular species present, it is essential to first measure the candidate molecules' spectra in the laboratory. However, direct application of these laboratory measurements to the interstellar medium (ISM) is complicated by the vastly different conditions present in space, including temperature, pressure, and density. To bridge this gap, a quantum mechanical analysis is necessary to derive a set of molecular parameters that can predict not only the frequencies of spectral lines but also their intensities in the ISM.
The spectra of complex organic molecules are often highly intricate due to several factors, including molecular asymmetry, the presence of numerous low-lying vibrational states, and the interactions between torsional, vibrational, and rotational motion. While modern laboratory techniques allow for rapid measurement of spectra, the subsequent quantum-mechanical analysis is labor-intensive and requires acquired expertise. Although the necessary software is already available the process involves many repetitive tasks that could be significantly expedited through the application of machine learning trained in the expertise required.
The project will focus on automating the spectral analysis process by applying sequence models such as LSTMs or Transformers to identify patterns in spectral data, classify spectral lines, and predict their shifts relative to theoretical values. Learning-based optimization methods (e.g., Bayesian optimization or reinforcement learning) can support iterative refinement of molecular parameters by minimizing RMS deviations. Additionally, unsupervised learning techniques (e.g., clustering, autoencoders) may assist in recognizing structures within complex spectra, especially in the presence of overlapping lines and noise.
The process will be verified using a molecule like formic anhydride ((HCO)2O)) for which human expert analysis has already begun, thus providing a benchmark to guide and evaluate the procedure before directing the analysis to new molecules of astrophysical interest.
The thesis will start by an acquisition of the expertise in spectral analysis at Toulouse. It will be continued by the application of machine learning in Krakow, Poland. Then finalized by the application of the technique for new research
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/

Funding category

Funding further details

Financement d'un établissement public Français

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder
Voir plus d'offres d'emploi
Estimer mon salaire
JE DÉPOSE MON CV

En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.

Offres similaires
Emploi Toulouse
Emploi Haute-Garonne
Emploi Midi-Pyrénées
Intérim Toulouse
Intérim Haute-Garonne
Intérim Midi-Pyrénées
Accueil > Emploi > Apprentissage automatique pour l'analyse guidée des spectres de laboratoire afin d'étudier les molécules précurseurs de la vie dans l'espace // Machine learning for guided analysis of laboratory spectra to study life-precursor molecules in space

Jobijoba

  • Conseils emploi
  • Avis Entreprise

Trouvez des offres

  • Emplois par métier
  • Emplois par secteur
  • Emplois par société
  • Emplois par localité
  • Emplois par mots clés
  • Missions Intérim
  • Emploi Alternance

Contact / Partenariats

  • Contactez-nous
  • Publiez vos offres sur Jobijoba
  • Programme d'affiliation

Suivez Jobijoba sur  Linkedin

Mentions légales - Conditions générales d'utilisation - Politique de confidentialité - Gérer mes cookies - Accessibilité : Non conforme

© 2025 Jobijoba - Tous Droits Réservés

Les informations recueillies dans ce formulaire font l’objet d’un traitement informatique destiné à Jobijoba SA. Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous disposez d’un droit d’accès et de rectification aux informations qui vous concernent. Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant. Pour en savoir plus, consultez vos droits sur le site de la CNIL.

Postuler
Créer une alerte
Alerte activée
Sauvegardée
Sauvegarder