Thèse soutenue

Réseaux neuronaux à base de graphes pour la génération de structures moléculaires synthétiquement accessibles

FR  |  
EN
Auteur / Autrice : Tagir Akhmetshin
Direction : Alexandre VarnekTimur Madzhidov
Type : Thèse de doctorat
Discipline(s) : Chimie informatique et théorique
Date : Soutenance le 17/03/2023
Etablissement(s) : Strasbourg en cotutelle avec Kazanskij gosudarstvennyj universitet im. V. I. Ulʹânova (Kazanʹ)
Ecole(s) doctorale(s) : École doctorale des Sciences chimiques (Strasbourg ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Chimie de la matière complexe (Strasbourg)
Jury : Président / Présidente : Esther Kellenberger
Rapporteurs / Rapporteuses : Véronique Stoven, Alban Lepailleur

Résumé

FR  |  
EN

Cette thèse est dédiée au développement de génératifs par réseaux de neurones artificiels de graphes et d'un outil de planification rétrosynthétique amélioré par des méthodes d’apprentissage automatique profond. Les modèles génératifs s'appuient sur le concept d'autoencodeur, très populaire dans les tâches de conception moléculaire de novo et d'analyse QSAR inverse. L'architecture proposée, HyFactor, basée sur le graphe étiqueté par le nombre d'hydrogènes par atome, se révèle performante et utile pour générer des analogues moléculaires. La seconde architecture proposée, VQGAE, donne des résultats comparables à ceux d'HyFactor dans la tâche de reconstruction, mais la représentation latente se montre plus performante pour la recherche par similarité et pour le QSAR. Ces performances sont illustrées par la génération de ligands très actifs pour les récepteurs A2A. La faisabilité synthétique des structures générées a été vérifiée à l'aide d'un nouvel outil de rétrosynthèse, GSLRetro. Cet outil est conçu sur le concept d'auto-apprentissage qui améliore la stabilité des solutions grâce aux précédentes solutions proposées. Le protocole de curation des données de réaction ainsi que de nouvelles techniques de validation croisée pour les modèles QSPR basés sur les réactions sont également présentés. En somme, la combinaison de ces outils constitue une étape importante vers la conception automatisée de molécules.