Cartographie topographique générative : un outil puissant pour la visualisation, l'analyse et la modélisation de données chimiques volumineuses
Auteur / Autrice : | Arkadii Lin |
Direction : | Alexandre Varnek |
Type : | Thèse de doctorat |
Discipline(s) : | Chemoinformatique |
Date : | Soutenance le 16/09/2019 |
Etablissement(s) : | Strasbourg |
Ecole(s) doctorale(s) : | École doctorale des Sciences chimiques (Strasbourg ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Chimie de la matière complexe (Strasbourg) |
Jury : | Président / Présidente : Matthieu Montes |
Examinateurs / Examinatrices : Alexandre Varnek, Matthieu Montes, Jürgen Bajorath, Bernd Beck, Didier Rognan | |
Rapporteurs / Rapporteuses : Matthieu Montes, Jürgen Bajorath |
Résumé
Cette thèse concerne l'utilisation de Cartographie Topographique Générative (Generative Topographie Mapping - GTM) pour l'analyse, la visualisation et la modélisation de grands volumes de données chimiques. Les principaux sujets traités dans ces travaux sont le criblage virtuel multi-cibles dans la conception de médicaments et la visualisation, l'analyse et la comparaison de grandes chimiothèques. Plusieurs développements méthodologiques ont été proposés : (1) un algorithme de zoom hiérarchique automatisé pour la GTM afin d'aider à résoudre le problème de la résolution des cartes ; (i1) un protocole d'extraction automatisé des Sous-structures Maximum Communes (MCS) pour améliorer l'efficacité de l'analyse de données ; (iit) un criblage contraint basé sur la GTM permettant de détecter les molécules avec un profil pharmacologique souhaité, et (iv) une technique de GTM parallèle, qui réduit significativement le temps nécessaire pour construire une carte. Les méthodologies développées ont été implémentées sous forme de logiciel, utilisé à la fois dans des projets académiques (Université de Strasbourg, France) et industriels (Compagnie Boehringer lngelheim Pharma, Allemagne)