Etudes des éléments cis-régulateurs : identification et caractérisation
Auteur / Autrice : | Jeanne Chèneby |
Direction : | Christine Brun, Benoît Ballester |
Type : | Thèse de doctorat |
Discipline(s) : | Génomique et Bioinformatique |
Date : | Soutenance le 19/12/2019 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | École Doctorale Sciences de la Vie et de la Santé (Marseille) |
Partenaire(s) de recherche : | Laboratoire : TAGC. Technological advances for genomics and clinics (marseille) |
Jury : | Président / Présidente : François Parcy |
Examinateurs / Examinatrices : Delphine Potier, Andrew Saurin | |
Rapporteur / Rapporteuse : Morgane Thomas-Chollier, Philipp Bücher |
Mots clés
Résumé
Le processus de régulation de la transcription des gènes repose très largement sur l’existence de séquences d’ADN non codantes dans le génome. Ces séquences d’ADN, appelées “éléments cis-régulateurs”, ont la particularité de recruter de nombreuses protéines capables de réguler le niveau de transcription des gènes. La fixation directe ou indirecte de ces protéines régulatrices sur les éléments cis-régulateurs permettent une régulation des gènes dans l’espace et dans le temps. L'accumulation massive des données de séquençage dans les banques de données publiques permet l'intégration de nombreuses expériences capturant les interactions entre les protéines régulatrice et l’ADN par des moyens bioinformatiques. Le but de mon doctorat a été d’annoter et traiter de façon uniforme les données brutes issues d’expériences de séquençage dont l’objectif est d’identifier les régions de fixation des protéines régulatrices pour l’Homme puis chez Arabidopsis Thaliana. Nous avons traité des données de ChIP-seq, ChIP-exo et DAP-seq afin d'élaborer plusieurs catalogues de régions régulatrices. Toutes ces données sont disponibles au sein du projet ReMap. Pour effectuer ces analyses nous avons développé des workflows reproductibles, scalables et portables sur des architectures différentes. Ces données ont aussi été utilisées pour identifier les sites de fixations reconnus par les facteurs de transcription et pour consolider la base de données JASPAR. Enfin, ce catalogue a été utilisé dans le développement d’une nouvelle méthode permettant de différencier les événements de fixations directes et indirectes par les protéines dans les résultats de ChIP-seq.