Annotation computationnelle de génomes : des organismes uniques aux communautés complexes
| Auteur / Autrice : | Francesco Strozzi |
| Direction : | Jean-François Zagury |
| Type : | Thèse de doctorat |
| Discipline(s) : | Biochimie et biologie moléculaire. Bioinformatique |
| Date : | Soutenance le 27/09/2024 |
| Etablissement(s) : | Paris, CNAM |
| Ecole(s) doctorale(s) : | École doctorale Sciences des métiers de l'ingénieur (Paris ; 2000-....) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire de Génomique, bioinformatique et chimie moléculaire (Paris) - Laboratoire Génomique, bioinformatique et chimie moléculaire |
| Jury : | Président / Présidente : David Vallenet |
| Examinateurs / Examinatrices : Aurélie Cobat, Rachel Morra, Jean-Louis Spadoni | |
| Rapporteurs / Rapporteuses : David Vallenet, Marie-France Sagot | |
| DOI : | 10.70675/c9da71c3zac1cz426fz8f3az8a3c7fcf3c17 |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L’analyse et l’annotation d’un génome est l’étape primordiale et nécessaire pour permettre une compréhension des fonctions biologiques d’un organisme. Dans les travaux ici présentés et qui couvrent plus de 14 ans de recherche dans le domaine de la génomique et de la bioinformatique, plusieurs approches d’analyse computationnelle ont été développés et appliqués pour identifier les gènes et déterminer les contenus des génomes d’organismes différents. Des procédures d’analyse bioinformatique ont été développés pour améliorer l’annotation dans un génome nouvellement assemblé, comme celui de la vache en 2007-2009, ce qui a permis d’identifier plusieurs centaines de gènes qui n’étaient encore pas annotés, comme les microARN, et des gènes issues d’autres espèces qui n’avaient pas encore été identifiés dans ce génome. Des travaux successifs se sont ensuite focalisés sur l’étude et la caractérisation du microbiome intestinal humain avec la détermination, par voie bioinformatique, de la plus large collection de protéines issues des bactéries de cette communauté complexe. Ces informations ont été inclues dans un nouveau catalogue unifié de référence pour le microbiome intestinal humaine, qui a été publié en 2021 et qui a servi comme base pour des nouvelles études censées explorer la composition de ce microbiome et son rôle dans la santé humaine. Parallèlement à ces travaux d’annotation de plusieurs génomes différents, des nouvelles librairies et outils bioinformatiques ont été développés. En 2011 un travail a été publié pour décrire la réalisation d’une librairie en langage Ruby, qui simplifiait l’accès à la base de données Ensembl, pour récupérer plus efficacement des informations essentielles sur la fonction et la séquence de gènes et génomes dans plusieurs espèces. En 2021 un autre travail a été publié, à la suite du développement d’une nouvelle méthode qui augmente la précision de la prédiction de gènes dans les milliers d’espèces bactériennes qui composent le microbiome humain. L’ensemble des travaux ici présentés a permis donc d’apporter des nouvelles connaissances pour les gènes existants dans plusieurs organismes et de développer des nouveaux outils pour supporter l’annotation de génomes, une activité complexe qui est à la base même de la génomique et sans laquelle des nombreux avancés dans la recherche de base, mais aussi dans la recherche appliquée dans les domaines de la biotechnologie, de la santé et du développement de médicaments, ne seraient pas possibles.