Etude des éléments régulateurs de l'expression des gènes chez l'humain
Auteur / Autrice : | Chloé Bessiere |
Direction : | Charles-Henri Lecellier |
Type : | Thèse de doctorat |
Discipline(s) : | Biologie Santé |
Date : | Soutenance le 27/11/2018 |
Etablissement(s) : | Montpellier |
Ecole(s) doctorale(s) : | Sciences Chimiques et Biologiques pour la Santé (Montpellier ; Ecole Doctorale ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Institut de Génétique Moléculaire de Montpellier |
Jury : | Président / Présidente : Thérèse Commes-Maerten |
Examinateurs / Examinatrices : Charles-Henri Lecellier, Thérèse Commes-Maerten, Anthony Mathelier, Cedric Notredame, Jean-Christophe Andrau, Raphaël Mourad | |
Rapporteur / Rapporteuse : Anthony Mathelier, Cedric Notredame |
Mots clés
Résumé
L'expression des gènes est étroitement régulée par différentes régions régulatrices afin d'assurer une grande variété de types cellulaires et de fonctions. Identifier ces régions régulatrices actives, leurs caractéristiques et comprendre comment elles interagissent entre elles dans chaque type cellulaire est un enjeu majeur. Cette connaissance permettrait notamment de mieux comprendre l'impact des variants génomiques très souvent localisés dans les régions non-codantes. Par ailleurs, le développement de cancers et autres maladies est lié à des dérégulations des contrôles de l'expression des gènes. Pour pouvoir envisager des traitements ciblés et tendre vers une médecine de précision, il est important de comprendre comment toute cette machinerie est orchestrée.Plusieurs approches ont été développées pour répondre à cette question, la plupart basées sur des données expérimentales de modification d'histones, méthylation et facteurs de transcription (TFs). Cependant, ces données sont limitées à des échantillons spécifiques et ne peuvent pas être générées pour tous les régulateurs et tous les patients. Mes travaux de thèse ont porté, dans une première partie, sur la modélisation de l'expression des gènes uniquement à partir de l'information contenue dans la séquence ADN. Nous avons utilisé un modèle linéaire avec sélection de variables, équivalent en terme de performances à des méthodes non paramétriques et simple à interpréter. Ce modèle m'a permis de comparer plusieurs types de variables basées sur la séquence ADN, comme les motifs de fixation des TFs et la composition nucléotidique. Ces variables sont déterminées pour différentes régions du gène afin d'évaluer leur pouvoir régulateur et leur contribution. Les introns seuls, dont la composition nucléotidique reflète celle de l'environnement du gène, expliquent une part importante de la variation de l'expression des gènes. De plus, nous avons démontré que les domaines topologiques (TADs), dans lesquels les interactions sont favorisées, partagent une composition génomique similaire. Notre modèle de prédiction nous permet vraisemblablement de capturer, pour chaque individu, la composition des TADs actifs.Dans un second temps de mon travail, je me suis intéressée aux régulations pouvant survenir dans les introns. Le consortium international FANTOM a fourni un des atlas de sites de départ de la transcription (TSSs) les plus importants à ce jour et nous avons noté que la majorité d'entre eux sont détectés dans les régions non-codantes, notamment les introns. Nous avons donc entrepris un travail visant à explorer ces TSS introniques. Pour déterminer si ces TSSs sont fonctionnels, je me suis intéressée à la recherche de potentiels motifs régulateurs autour de ces signaux de transcription. Une fraction de ces signaux sont localisés 2 bases en aval d'une répétition de Thymidines (T). Des évidences biochimiques et génétiques suggèrent qu'au moins une partie de ces signaux correspondent à de longs ARNs non-codants sens-introniques exprimés de manière tissu-spécifique. Il semblerait également que la longueur des répétitions de Ts ait une influence sur la présence d'un signal de transcription au niveau de ces loci et, indirectement, sur l'expression du gène hôte. Ces observations offrent une possible base moléculaire à l'effet de ces courtes répétitions en tandem de T.