Expression tissulaire des gènes paralogues : application au cerveau humain et à son état pathologique
Auteur / Autrice : | Solène Julien |
Direction : | Vincent Frouin |
Type : | Thèse de doctorat |
Discipline(s) : | Imagerie et physique médicale |
Date : | Soutenance le 19/12/2017 |
Etablissement(s) : | Université Paris-Saclay (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Electrical, optical, bio : physics and engineering (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : Université Paris-Sud (1970-2019) |
Laboratoire : Unité d'analyse et de traitement de l'information (UNATI) | |
Jury : | Président / Présidente : Christophe Ambroise |
Examinateurs / Examinatrices : Vincent Frouin, Christophe Ambroise, Marc Robinson-rechavi, Hervé Isambert, Claudine Landés, Jean-François Deleuze, Edith Le floch, Christophe Battail | |
Rapporteur / Rapporteuse : Marc Robinson-rechavi, Hervé Isambert |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Dans l’histoire évolutive, deux gènes paralogues sont issus d’un évènement de duplication de leur ancêtre commun. Les gènes paralogues sont caractérisés par des duplications globales de génome (WGD) ou à petite échelle (SSD) et par leur datation. Les WGDs ont lieu à deux reprises à la base de la lignée des vertébrés. Les évènements de SSD ont lieu à plusieurs moments pouvant être plus récents, plus anciens ou contemporain de la période des évènements de WGD. La rétention des paralogues dans le génome, associée à une divergence de l’expression spatiale est une contribution importante pour l’augmentation de la complexité de l’organisme au cours de l’évolution. Certaines études ont montré que les duplications anciennes seraient plus associées aux maladies. L’objectif de la première partie de la thèse est de créer une ressource sur les paralogues en collectant et en analysant différentes annotations. Nous avons construit une ressource robuste de paralogues humains à partir de listes publiées mais aussi à partir d’annotations externes. L’exploration de différentes annotations nous a permis d’identifier une identité de séquence élevée entre gènes paralogues pouvant biaiser la mesure d’expression des gènes et diminuer leur expression. L’objectif de la seconde partie, est d’explorer l’expression spatiale et la co- expression des paralogues au sein du cerveau humain, à partir des données RNA-seq du consortium GTEx. Les données d’expression GTEx de 13 tissus cérébraux, nous ont permis de montrer que la datation récente mais aussi que le type SSD contribuaient à une expression plus tissu-spécifique. Nous avons utilisé l’analyse de la co-expression (WGCNA) afin de regrouper les paralogues possédant une expression similaire au travers des tissus et nous avons pu suggérer une co-expression des SSD récents. Nos études sur les maladies ont montré que les SSD récents accumulaient des mutations associées à des maladies cérébrales. Finalement, nous avons trouvé que la co-expression des paralogues et leur tissu-spécificité au travers des régions cérébrales pouvaient enrichir nos connaissances sur les gènes associés à des maladies cérébrales.