Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
Auteur / Autrice : | Ali Bakiri |
Direction : | Jean-Hugues Renault, Jean-Marc Nuzillard |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences - STS |
Date : | Soutenance le 31/05/2018 |
Etablissement(s) : | Reims |
Ecole(s) doctorale(s) : | Ecole doctorale Sciences, technologies, santé (Reims, Marne ; 2000-2011) |
Partenaire(s) de recherche : | Laboratoire : Institut de Chimie Moléculaire de Reims (ICMR - UMR 7312 CNRS) (Reims, Marne, 2012-....) |
Jury : | Président / Présidente : Jean-Luc Wolfender |
Examinateurs / Examinatrices : Jean-Hugues Renault, Jean-Marc Nuzillard, Jane Hubert | |
Rapporteurs / Rapporteuses : Marc-André Delsuc, Guy Lippens |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L’émergence des méthodes de déréplication comme moyen d’identification rapide des substances naturelles connues implique le développement conjoint d’outils informatiques dédiés au traitement et à l’analyse des données spectrales. Dans ce contexte, les travaux présentés dans ce mémoire ont porté sur le développement de deux méthodes in silico de déréplication par résonance magnétique nucléaire (RMN). La première méthode, DerepCrud, permet l’identification des molécules naturelles à partir d’extraits naturels bruts en utilisant des données de RMN du 13C. La méthode permet de comparer des spectres de RMN 1D du 13C issus de l’analyse d’un extrait naturel à ceux des molécules naturelles répertoriées dans une base de données locale afin de pouvoir identifier les composés majoritaires. La deuxième méthode, BCNet, permet d’exploiter les données RMN bidimensionnelles (HMBC et HSQC) pour la déréplication de molécules naturelles. L’algorithme construit un réseau de corrélations HMBC formés par les signaux appartenant aux différentes molécules constituant un extrait puis isole les signaux de chaque molécule grâce à l’utilisation d’algorithmes de détection de communautés. Les molécules sont enfin identifiées en effectuant une recherche dans la base de données des corrélations HMBC. A la fin de la procédure, la présence des molécules identifiées est confirmée par une comparaison de leurs corrélations HSQC théoriques (aussi issues de la base de données) avec les corrélations expérimentales correspondantes afin de renforcer la précision de l’identification.