L'analyse de la rugosité des relations structure-activité et son exploitation pour concevoir des modèles d'apprentissage automatique robustes pour des applications en chimie.
Auteur / Autrice : | Guanming Chen |
Direction : | Thijs Stuyver |
Type : | Projet de thèse |
Discipline(s) : | Chimie Physique |
Date : | Inscription en doctorat le 01/11/2024 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Chimie physique et chimie analytique de Paris Centre |
Partenaire(s) de recherche : | Laboratoire : Institute of Chemistry for Life and Health Sciences |
Equipe de recherche : Chimie Théorique et Modélisation (TCM) | |
établissement opérateur d'inscription : Chimie ParisTech / École Nationale Supérieure de Chimie de Paris (ENSCP) |
Résumé
Le présent projet vise à mieux comprendre comment la rugosité de la Relation Structure-Activité (SAR) impacte la modélisabilité. À cette fin, la rugosité de plusieurs représentations sera analysée, et des comparaisons seront effectuées entre des représentations issues d'une stratégie de pré-entraînement et des descripteurs inspirés par les connaissances du domaine (chimiques quantiques). Cette compréhension sera ensuite appliquée pour concevoir des modèles d'apprentissage automatique fondamentaux pour des applications en chimie, en imposant des contraintes/hypothèses sur la rugosité dans l'architecture de pré-entraînement auto-supervisée et en utilisant la rugosité comme outil de diagnostic pour évaluer les performances des modèles pré-entraînés.