Thèse soutenue

Annotation computationnelle de génomes : des organismes uniques aux communautés complexes

FR  |  
EN
Auteur / Autrice : Francesco Strozzi
Direction : Jean-François Zagury
Type : Thèse de doctorat
Discipline(s) : Biochimie et biologie moléculaire. Bioinformatique
Date : Soutenance le 27/09/2024
Etablissement(s) : Paris, CNAM
Ecole(s) doctorale(s) : École doctorale Sciences des métiers de l'ingénieur (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de Génomique, bioinformatique et chimie moléculaire (Paris) - Laboratoire Génomique, bioinformatique et chimie moléculaire
Jury : Président / Présidente : David Vallenet
Examinateurs / Examinatrices : Aurélie Cobat, Rachel Morra, Jean-Louis Spadoni
Rapporteurs / Rapporteuses : David Vallenet, Marie-France Sagot
DOI : 10.70675/c9da71c3zac1cz426fz8f3az8a3c7fcf3c17

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L’analyse et l’annotation d’un génome est l’étape primordiale et nécessaire pour permettre une compréhension des fonctions biologiques d’un organisme. Dans les travaux ici présentés et qui couvrent plus de 14 ans de recherche dans le domaine de la génomique et de la bioinformatique, plusieurs approches d’analyse computationnelle ont été développés et appliqués pour identifier les gènes et déterminer les contenus des génomes d’organismes différents. Des procédures d’analyse bioinformatique ont été développés pour améliorer l’annotation dans un génome nouvellement assemblé, comme celui de la vache en 2007-2009, ce qui a permis d’identifier plusieurs centaines de gènes qui n’étaient encore pas annotés, comme les microARN, et des gènes issues d’autres espèces qui n’avaient pas encore été identifiés dans ce génome. Des travaux successifs se sont ensuite focalisés sur l’étude et la caractérisation du microbiome intestinal humain avec la détermination, par voie bioinformatique, de la plus large collection de protéines issues des bactéries de cette communauté complexe. Ces informations ont été inclues dans un nouveau catalogue unifié de référence pour le microbiome intestinal humaine, qui a été publié en 2021 et qui a servi comme base pour des nouvelles études censées explorer la composition de ce microbiome et son rôle dans la santé humaine. Parallèlement à ces travaux d’annotation de plusieurs génomes différents, des nouvelles librairies et outils bioinformatiques ont été développés. En 2011 un travail a été publié pour décrire la réalisation d’une librairie en langage Ruby, qui simplifiait l’accès à la base de données Ensembl, pour récupérer plus efficacement des informations essentielles sur la fonction et la séquence de gènes et génomes dans plusieurs espèces. En 2021 un autre travail a été publié, à la suite du développement d’une nouvelle méthode qui augmente la précision de la prédiction de gènes dans les milliers d’espèces bactériennes qui composent le microbiome humain. L’ensemble des travaux ici présentés a permis donc d’apporter des nouvelles connaissances pour les gènes existants dans plusieurs organismes et de développer des nouveaux outils pour supporter l’annotation de génomes, une activité complexe qui est à la base même de la génomique et sans laquelle des nombreux avancés dans la recherche de base, mais aussi dans la recherche appliquée dans les domaines de la biotechnologie, de la santé et du développement de médicaments, ne seraient pas possibles.