Thèse soutenue

Méthodes d'apprentissage automatique pour l'étude par computationnelle des origines de la vie

FR  |  
EN
Auteur / Autrice : Timothée Devergne
Direction : Antonino Marco SaittaFabio Pietrucci
Type : Thèse de doctorat
Discipline(s) : Physique et chimie des matériaux
Date : Soutenance le 18/09/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Physique et chimie des matériaux (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Institut de minéralogie, de physique des matériaux et de cosmochimie (Paris ; 1997-....)
Jury : Président / Présidente : Mathieu Salanne
Examinateurs / Examinatrices : Ambroise Van Roekeghem, Gabriel Stoltz
Rapporteurs / Rapporteuses : Héléna Zapolsky, Roberta Poloni

Résumé

FR  |  
EN

La chimie prébiotique consiste en l’étude des réactions chimiques aux origines de la vie sur Terre. C’est un très vaste sujet qui mobilise plusieurs domaines scientifiques dont la physique numérique. En effet, des simulations de dynamiques moléculaire de haute précision peuvent être menées pour tester l’influence de différents environnements plausibles sur la synthèse de molécules : ce composant a-t-il pu apparaître dans le milieu interstellaire ? Sa formation est-elle favorisée par la présence de surfaces minérales ? Elles peuvent aussi être utilisées pour identifier des intermédiaires réactionnels trop peu stables pour être observés expérimentalement et mieux comprendre les mécanismes de formation. Pour cela, des méthodes d’échantillonnage avancé (EA) comme la metadynamique ou l’umbrella sampling sont utilisées pour explorer et échantillonner l’espace chimique. Ces méthodes peuvent être utilisées par exemple pour étudier la synthèse des acides aminés, qui constituent les briques de base des protéines, des molécules clés pour le vivant. Cela a été fait par Magrino et al, avec l’étude de la synthèse par voie de Strecker de la glycine, l’acide aminé le plus simple, en milieu aqueux. Cela a permis d’identifier tous les intermédiaires réactionnels présents dans cette voie de synthèse et de caractériser leur stabilité relative. Cependant, ces simulations dites ab initio qui prennent en compte les degrés de liberté électroniques ont un coût de calcul élevé et seuls de petits systèmes de l’ordre de la centaine d’atomes peuvent être étudiés. Pour remédier à ce problème, des méthodes d’apprentissage automatique (AA) qui permettent de réduire ce temps de calcul ont été mises en places pour des systèmes à l’équilibre. Peu d’études ont proposé des méthodes d’AA s’appliquant à des événements réactifs qui nécessitent un modèle précis sur l’entièreté de l’espace chimique en conjonction avec l’usage de méthodes d’EA. Dans un premier temps, nous nous appuyons sur les données existantes de la première étape de la synthèse prébiotique de Strecker de la glycine pour développer une méthode d’entraînement de modèles d’AA pour l’étude de réactions chimiques en solution. Nous commençons par entraîner un ensemble de modèles, appelé commité, avec le même ensemble d’entraînement mais des conditions initiales différentes. Au cours d’une simulation, nous pouvons suivre l’évolution temporelle de la différence de prédictions des forces au sein du modèle et lorsque le système se trouve en dehors de la zone d’entraînement du modèle nous constatons que cette différence augmente, ce qui nous permet de quantifier la qualité de la prédiction et définir un temps de simulation pendant lequel le modèle se comporte comme une simulation ab initio. Grâce à cela, nous pouvons cibler dans l’espace chimique quelles nouvelles données utiliser pour entraîner un modèle plus performant. En utilisant cette méthode nous parvenons à obtenir des données proches des données ab initio. Nous appliquons ensuite cette nouvelle méthode à un chemin de synthèse prébiotique de la glycine en milieu aqueux différent de celui de Strecker. Ce chemin n’avait jamais été exploré auparavant. Cependant, la méthode développée précédemment nécessite une connaissance préalable du mécanisme de transition. Dans la deuxième partie de cette thèse, nous utilisons des trajectoires ab initio d’échantillonnage de chemin de transition qui sont des trajectoires démarrant de l’état de transition vers les bassins d’équilibre qui couvrent l’entièreté de l’espace chimique et qui ne demande pas une caractérisation préalable du mécanisme. Ces trajectoires sont utilisées pour entraîner un modèle qui peut-être utilisé pour récupérer les données thermodynamiques mais aussi cinétiques d’une réaction avec une qualité ab initio pour un moindre coût.