Etude bioinformatique des lectines : nouvelle classification et prédiction dans les génomes
Auteur / Autrice : | François Bonnardel |
Direction : | Anne Imberty, Frédérique Lisacek |
Type : | Thèse de doctorat |
Discipline(s) : | Chimie biologie |
Date : | Soutenance le 08/02/2021 |
Etablissement(s) : | Université Grenoble Alpes en cotutelle avec Université de Genève |
Ecole(s) doctorale(s) : | École doctorale chimie et science du vivant (Grenoble ; 199.-....) |
Partenaire(s) de recherche : | Laboratoire : Centre de recherches sur les macromolécules végétales (Grenoble ; 1966-....) |
Equipe de recherche : Proteome Informatics Group | |
Jury : | Président / Présidente : Sabine Hediger |
Examinateurs / Examinatrices : Anne Imberty, Frédérique Lisacek, Valérie Barbié, Amos Bairoch, Stéphane Téletchéa | |
Rapporteur / Rapporteuse : Vincent Zoete, Alexandre de Brevern |
Mots clés
Mots clés contrôlés
Résumé
Les domaines de la bioinformatique utilisent des concepts mathématiques et des outils informatiques pour démêler les connaissances dans les données biologiques. Lorsque la bioinformatique est appliquée aux glycanes et à la glycobiologie, elle est appelée glyco-informatique. Les nouvelles technologies permettent le séquençage massif des génomes de nouvelles espèces et des métagénomes d'échantillons environnementaux. Mais tous les génomes nouvellement découverts et les protéines encodées ne sont que partiellement annotés d'une fonction biologique, récupérée par similarité à partir des organismes de référence.La glycobiologie est le domaine de recherche consacré à l'étude des glycanes/glucides, composés d'un ou de plusieurs monosaccharides. Les lectines sont des protéines capables de se lier de manière réversible aux glycanes, et sans fonctions enzymatiques. Les lectines sont des outils puissants pour la reconnaissance des glycanes dans les échantillons, et elles sont également des cibles pour les composés thérapeutiques en raison de leur implication dans le cancer, l'immunologie et les infections.Cette thèse vise à utiliser la bioinformatique pour développer de nouveaux outils in-silico pour l'étude des lectines. Elle a pour objectif de fournir, dans une nouvelle base de données en ligne, des informations sur les lectines pour les organismes de référence et les nouveaux génomes appartenant à d’autres organismes.Pour fournir une classification des structures 3D des lectines et leur annotation dans les génomes, un portail web dédié a été développé, appelé UniLectin. Le module UniLectin3D fournit des structures 3D classées et stockées manuellement, ainsi que leurs glycanes en interaction. En raison de la difficulté d'identifier les lectines répétées en tandem dans les génomes, une méthode spécifique a été mise au point pour permettre la prédiction de ses lectines particulières, maintenant disponibles dans les modules PropLec et TrefLec. Enfin, le module LectomeXplore fournit des lectines prédites basées sur les 107 classes de UniLectin3D, dans les génomes disponibles du NCBI et d'UniProt. Cela a permis l'étude des lectomes de différents environnements par le biais de la collaboration, dans la dernière partie de la thèse.