Thèse soutenue

Distributions de familles de gènes à travers génomes bactériens : modèles à données de génomique évolutionnaires

FR  |  
EN
Auteur / Autrice : Eleonora De Lazzari
Direction : Marco Cosentino Lagomarsino
Type : Thèse de doctorat
Discipline(s) : Physique
Date : Soutenance le 08/11/2017
Etablissement(s) : Paris 6
Ecole(s) doctorale(s) : École doctorale Physique en Île-de-France (Paris ; 2014-....)
Partenaire(s) de recherche : Laboratoire : Biologie computationnelle et quantitative (Paris ; 2011-....)
Jury : Président / Présidente : Aleksandra Walczak
Examinateurs / Examinatrices : Amos Maritan, Namiko Mitarai
Rapporteurs / Rapporteuses : Bianca Sclavi, Didier Chatenay

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La génomique comparative est un sujet essentiel pour éclaircir la biologie évolutionnaire. La première étape pour dépasser une connaissance seulement descriptive est de développer une méthode pour représenter le contenu du génome. Nous avons choisi la représentation modulaire des génomes pour étudier les lois quantitatives qui réglementent leur composition en unités élémentaires de type fonctionnel ou évolutif. La première partie de la thèse se fonde sur l'observation que le nombre de domaines ayant la même fonction est lié à la taille du génome par une loi de puissance. Puisque les catégories fonctionnelles sont des agrégats de familles de domaines, on se demande comment le nombre de domaines dans la même catégorie fonctionnelle est lié à l'évolution des familles. Le résultat est que les familles suivent également une loi de puissance. Le deuxième partie présente un modèle positif qui construit une réalisation à partir des composants liés dans un réseau de dépendance. L'ensemble de toutes les réalisations reproduit la distribution des composants partagés et la relation entre le nombre de familles distinctes et la taille du génome. Le dernier chapitre étend l'approche modulaire aux écosystèmes microbiens. Sur la base des constatations que nous avons faites sur les lois de puissance pour les familles de domaines, nous avons analysé comment le nombre de familles dans un metagénome en est influencé. Par conséquence, nous avons défini une nouvelle observable dont la forme fonctionnelle comprend des informations quantitatives sur la composition originelle du metagénome.