Thèse soutenue

Étude des éléments cis-régulateurs à différentes échelles : approches fondamentales à appliquer

FR  |  
EN
Auteur / Autrice : Fayrouz Hammal
Direction : Benoît Ballester
Type : Thèse de doctorat
Discipline(s) : Génomique et Bioinformatique
Date : Soutenance le 10/05/2023
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École Doctorale Sciences de la Vie et de la Santé (Marseille)
Partenaire(s) de recherche : Laboratoire : TAGC. Technological advances for genomics and clinics (marseille)
Collectivité : Provence-Alpes-Côte d'Azur. Conseil régional
Jury : Président / Présidente : Denis Puthier
Examinateurs / Examinatrices : Anaïs Bardet, Pascal Rihet, Mileidys Perez Alea
Rapporteur / Rapporteuse : Camille Berthelot, Gaël Cristofari

Résumé

FR  |  
EN

L'ADN non-codant a longtemps été considéré comme inutile. Cependant, grâce aux avancées technologiques dans le domaine de la génomique, les chercheurs ont réalisé l'importance de ces régions dans la régulation des gènes. Les acteurs de la régulation sont les éléments cis-régulateurs (CRE) tels que les promoteurs et enhancers. Ces éléments sont fixés par des protéines appelées facteurs de la transcription (TF), qui se fixent à des sites de fixation spécifique. Les TF agissent seuls ou sous forme de complexes pour recruter l'ARN polymérase II et initier la transcription. Avec l'avénement des techniques de séquençage à haut débit, une technique permettant de détecter la fixation des protéines à l'ADN a vu le jour, le ChIP-seq. Les données résultantes sont stockées dans des entrepôts de données tels que GEO. Cependant, il existe une grande diversité dans la manière dont les expériences ChIP-seq sont conçues. Le projet ReMap, lancé en 2012, vise à identifier les régions régulatrices en annotant et intégrant ces données uniformormément. En 2022, j'ai ajouté deux nouvelles espèces au catalogue: Mus musculus et Drosophila melanogaster et la mise à jour pour l'Homme et Arabidopsis thaliana. Le catalogue chez l'Homme comprend 1210 TF et 182 millions de pics ChIP-seq. L'augmentation continue des données intégrées a nécessité de nouveaux filtres qualités. Ces données sont visualisables sur le navigateur de génomes de UCSC et peuvent être filtrés en fonction des TF et biotypes. Enfin, nous avons tenté de déterminer une spécificité tissulaire des modules de régulations ReMap à l'aide de la méthode ChromHMM. Les résultats préliminaires permettent de distinguer 11 tissus avec un modèle à 25 états.La deuxième partie de ma thèse se concentre sur l'impact des éléments transposables (TE) sur l'insertion de site de fixation au TF dans les génomes au cours de l'évolution. Il y a plus de 50 ans, Barbara McClintock a découvert pour la première fois les éléments transposables dans le maïs (Zea mays) et les a appelés ''éléments de contrôle''. Depuis, les chercheurs s'éfforcent de classer et caractériser ces TE. Des travaux en génomiques décrivent les TE comme une source abondante de matériaux pour l'assemblage et la modification des systèmes régulateurs des gènes eucaryotes au cours de l'évolution. Nous avons donc réalisé une analyse à grande échelle afin de déterminer l'étendue de ce phénomène. Pour ce faire, nous avons réalisé une analyse d'enrichissement des 1210 pics TF de ReMap sur les TE avec l'outil LOLA. On identifie donc 15,441 paires de TE/TF significativement associés. A l'aide de l'outil FIMO nous avons détecté la présence des motifs de fixation des TF dans la séquence des TE associés pour 7,757 paires. Nous avons observé une spécificité de l'association TE/TF aux groupes de TF et aux familles de TE. Après avoir visualisé l'alignement des séquences de TE nous observons que les motifs sont alignés, témoignant de leur conservation au cours de l'évolution. Nous avons également observé que l'âge d'insertion des TE associés est différent pour chaque groupe de TF.Enfin, nous avons réalisé un projet en collaboration avec Advanced BioDesign (ABD) qui porte sur la régulation des ALDH. En effet, la surexpression des ALDH est associée à un mauvais pronostic chez les patients atteints d'AML. ABD a donc développé un traitement inhibiteur des ALDH, le DIMMATE. Dans ce contexte, nous cherchons à mieux comprendre les mécanismes de la régulation de l'ALDH1A1. J'ai donc cartographié les éléments régulateurs autour de ce gène à l'aide de données multi-omiques. Au cours de notre analyse, nous avons identifié 14 régions régulatrices autour du gène ALDH1A1. Nos résultats ont ensuite été communiqués à nos collaborateurs afin de procéder aux validation expérimentales qui sont encore en cours.Ces travaux se sont portés à trois niveaux de recherche 1) à très grande échelle, 2) à l'échelle génomique ''évolutive'' et 3) focalisés sur un locus précis.