Thèse soutenue

Expression tissulaire des gènes paralogues : application au cerveau humain et à son état pathologique

FR  |  
EN
Auteur / Autrice : Solène Julien
Direction : Vincent Frouin
Type : Thèse de doctorat
Discipline(s) : Imagerie et physique médicale
Date : Soutenance le 19/12/2017
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Electrical, optical, bio : physics and engineering (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Université Paris-Sud (1970-2019)
Laboratoire : Unité d'analyse et de traitement de l'information (UNATI)
Jury : Président / Présidente : Christophe Ambroise
Examinateurs / Examinatrices : Vincent Frouin, Christophe Ambroise, Marc Robinson-rechavi, Hervé Isambert, Claudine Landés, Jean-François Deleuze, Edith Le floch, Christophe Battail
Rapporteurs / Rapporteuses : Marc Robinson-rechavi, Hervé Isambert

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans l’histoire évolutive, deux gènes paralogues sont issus d’un évènement de duplication de leur ancêtre commun. Les gènes paralogues sont caractérisés par des duplications globales de génome (WGD) ou à petite échelle (SSD) et par leur datation. Les WGDs ont lieu à deux reprises à la base de la lignée des vertébrés. Les évènements de SSD ont lieu à plusieurs moments pouvant être plus récents, plus anciens ou contemporain de la période des évènements de WGD. La rétention des paralogues dans le génome, associée à une divergence de l’expression spatiale est une contribution importante pour l’augmentation de la complexité de l’organisme au cours de l’évolution. Certaines études ont montré que les duplications anciennes seraient plus associées aux maladies. L’objectif de la première partie de la thèse est de créer une ressource sur les paralogues en collectant et en analysant différentes annotations. Nous avons construit une ressource robuste de paralogues humains à partir de listes publiées mais aussi à partir d’annotations externes. L’exploration de différentes annotations nous a permis d’identifier une identité de séquence élevée entre gènes paralogues pouvant biaiser la mesure d’expression des gènes et diminuer leur expression. L’objectif de la seconde partie, est d’explorer l’expression spatiale et la co- expression des paralogues au sein du cerveau humain, à partir des données RNA-seq du consortium GTEx. Les données d’expression GTEx de 13 tissus cérébraux, nous ont permis de montrer que la datation récente mais aussi que le type SSD contribuaient à une expression plus tissu-spécifique. Nous avons utilisé l’analyse de la co-expression (WGCNA) afin de regrouper les paralogues possédant une expression similaire au travers des tissus et nous avons pu suggérer une co-expression des SSD récents. Nos études sur les maladies ont montré que les SSD récents accumulaient des mutations associées à des maladies cérébrales. Finalement, nous avons trouvé que la co-expression des paralogues et leur tissu-spécificité au travers des régions cérébrales pouvaient enrichir nos connaissances sur les gènes associés à des maladies cérébrales.