La construction du réseau de régulation transcriptionnelle
Auteur / Autrice : | Islam Sultan |
Direction : | Sophie Schbath, Pierre Nicolas |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de la vie et de la santé |
Date : | Soutenance le 21/06/2019 |
Etablissement(s) : | Université Paris-Saclay (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Structure et dynamique des systèmes vivants (Gif-sur-Yvette, Essonne ; 2015-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : Université Paris-Sud (1970-2019) |
Laboratoire : Mathématiques et Informatique Appliquées du Génome à l'Environnement (Jouy-en-Josas, Yvelines) | |
Jury : | Président / Présidente : Stéphane Robin |
Examinateurs / Examinatrices : Sophie Schbath, Pierre Nicolas, Stéphane Robin, Grégory Nuel, Denis Thieffry, Juliette Martin | |
Rapporteur / Rapporteuse : Grégory Nuel, Denis Thieffry |
Résumé
Une part prépondérante de la régulation au niveau transcriptionnel passe par la modulation du taux d’initiation de la transcription. Chez les bactéries,l’initiation de la transcription implique la reconnaissance par le facteur sigma de l’ANR polymérase d’un motif de séquence particulier localisé approximativement10 bp en amont du site d’initiation de la transcription(TSS). Elle est modulée par la fixation de facteurs de transcription qui reconnaissent d’autres motifs à proximité. La technologie RNA-Seq donne accès au répertoire des TSS et des unités de transcriptions et offre donc des perspectives renouvelées pour s’attaquer au problème de l’identification des motifs de fixation des facteurs de transcription. Ce travail de thèse a visé à évaluer les outils existants et à développer de nouvelles méthodes pour la prédiction des sites de fixation des facteurs de transcription en combinant l’information des profils d’expression et des positions des TSS. Plusieurs approches fondées sur les modèles de matrices poids-position (PWM) vont être explorées pour étendre le modèle de mélange classiquement utilisé en relâchant l’hypothèse selon laquelle les motifs correspondants aux différents sites de fixations apparaissent indépendamment dans les différentes régions promotrices. Dans les nouveaux modèles, nous prendrons explicitement en compte une probabilité supérieure d’apparition d’un même motif dans des promoteurs dont les profils d’activité sont similaires. Une attention particulière sera aussi portée à la position du motif par rapport au TSS et au site de fixation du facteur sigma. En parallèle des développements méthodologiques nous travaillerons aussi sur l’utilisation de ces approches pour reconstruire le réseau des régulations transcriptionnelles chez L. monocytogenes en s’appuyant sur les données de la littérature et du projet List MAPS. Enfin,nous envisageons d’utiliser l’information sur le réseau de régulation pour étudier un point particulier qui serait pertinent.