Bioinformatics study of lectins : new classification and prediction in genomes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Bioinformatics study of lectins : new classification and prediction in genomes

Etude bioinformatique des lectines : nouvelle classification et prédiction dans les génomes

Résumé

Bioinformatics uses mathematical concepts and informatics tools to unravel the knowledge hidden in biological data. When bioinformatics is applied to glycans and glycobiology, it is called glyco-informatics. New technologies allow mass sequencing of new species genomes and of environmental samples metagenomes. But all newly discovered genomes and encoded proteins are only partially annotated with biological function assessed by similarities to reference organisms.Glycobiology is the research field dedicated to the study of glycan/carbohydrate compounds, composed of one or multiple monosaccharides. Lectins are proteins able to bind reversibly to glycans, and without enzymatic functions. Lectins are powerful tools for the recognition of glycans in samples, and they are also targets for therapeutic compounds due to their involvement in cancer, immunology and infections.This thesis aims to use bioinformatics for developing new in silico tools for the study of lectins. More specifically, it addresses the need for a new online database covering curated information on lectins for both reference organisms and newly sequenced genomes belonging to other organisms.To provide a curated classification of lectin 3D structures and their annotation in genomes, a dedicated web portal called UniLectin, was developed and includes several modules. The UniLectin3D module provides manually curated and classified 3D structures together with their interacting glycans. Due to the difficulty of identifying tandem repeated lectins in genomes, a specific method has been developed for the prediction of those particular lectins, now available in the PropLec and TrefLec modules. Finally, the LectomeXplore module includes lectin predictions based on 107 classes defined on the basis of UniLectin3D content, and resulting from screening available sequences stored in the reference protein databases NCBI-nr and UniProt. This made the study of lectomes in different environments possible as collaborative work described in the last part of the thesis.
Les domaines de la bioinformatique utilisent des concepts mathématiques et des outils informatiques pour démêler les connaissances dans les données biologiques. Lorsque la bioinformatique est appliquée aux glycanes et à la glycobiologie, elle est appelée glyco-informatique. Les nouvelles technologies permettent le séquençage massif des génomes de nouvelles espèces et des métagénomes d'échantillons environnementaux. Mais tous les génomes nouvellement découverts et les protéines encodées ne sont que partiellement annotés d'une fonction biologique, récupérée par similarité à partir des organismes de référence.La glycobiologie est le domaine de recherche consacré à l'étude des glycanes/glucides, composés d'un ou de plusieurs monosaccharides. Les lectines sont des protéines capables de se lier de manière réversible aux glycanes, et sans fonctions enzymatiques. Les lectines sont des outils puissants pour la reconnaissance des glycanes dans les échantillons, et elles sont également des cibles pour les composés thérapeutiques en raison de leur implication dans le cancer, l'immunologie et les infections.Cette thèse vise à utiliser la bioinformatique pour développer de nouveaux outils in-silico pour l'étude des lectines. Elle a pour objectif de fournir, dans une nouvelle base de données en ligne, des informations sur les lectines pour les organismes de référence et les nouveaux génomes appartenant à d’autres organismes.Pour fournir une classification des structures 3D des lectines et leur annotation dans les génomes, un portail web dédié a été développé, appelé UniLectin. Le module UniLectin3D fournit des structures 3D classées et stockées manuellement, ainsi que leurs glycanes en interaction. En raison de la difficulté d'identifier les lectines répétées en tandem dans les génomes, une méthode spécifique a été mise au point pour permettre la prédiction de ses lectines particulières, maintenant disponibles dans les modules PropLec et TrefLec. Enfin, le module LectomeXplore fournit des lectines prédites basées sur les 107 classes de UniLectin3D, dans les génomes disponibles du NCBI et d'UniProt. Cela a permis l'étude des lectomes de différents environnements par le biais de la collaboration, dans la dernière partie de la thèse.
Fichier principal
Vignette du fichier
BONNARDEL_2021_diffusion.pdf (14.07 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03331649 , version 1 (02-09-2021)

Identifiants

  • HAL Id : tel-03331649 , version 1

Citer

François Bonnardel. Bioinformatics study of lectins : new classification and prediction in genomes. Structural Biology [q-bio.BM]. Université Grenoble Alpes [2020-..]; Université de Genève, 2021. English. ⟨NNT : 2021GRALV010⟩. ⟨tel-03331649⟩
316 Consultations
199 Téléchargements

Partager

Gmail Facebook X LinkedIn More