Thèse soutenue

La construction du réseau de régulation transcriptionnelle

FR  |  
EN
Auteur / Autrice : Islam Sultan
Direction : Sophie SchbathPierre Nicolas
Type : Thèse de doctorat
Discipline(s) : Sciences de la vie et de la santé
Date : Soutenance le 21/06/2019
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Structure et dynamique des systèmes vivants (Gif-sur-Yvette, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Université Paris-Sud (1970-2019)
Laboratoire : Mathématiques et Informatique Appliquées  du Génome à l'Environnement (Jouy-en-Josas, Yvelines)
Jury : Président / Présidente : Stéphane Robin
Examinateurs / Examinatrices : Sophie Schbath, Pierre Nicolas, Stéphane Robin, Grégory Nuel, Denis Thieffry, Juliette Martin
Rapporteur / Rapporteuse : Grégory Nuel, Denis Thieffry

Résumé

FR  |  
EN

Une part prépondérante de la régulation au niveau transcriptionnel passe par la modulation du taux d’initiation de la transcription. Chez les bactéries,l’initiation de la transcription implique la reconnaissance par le facteur sigma de l’ANR polymérase d’un motif de séquence particulier localisé approximativement10 bp en amont du site d’initiation de la transcription(TSS). Elle est modulée par la fixation de facteurs de transcription qui reconnaissent d’autres motifs à proximité. La technologie RNA-Seq donne accès au répertoire des TSS et des unités de transcriptions et offre donc des perspectives renouvelées pour s’attaquer au problème de l’identification des motifs de fixation des facteurs de transcription. Ce travail de thèse a visé à évaluer les outils existants et à développer de nouvelles méthodes pour la prédiction des sites de fixation des facteurs de transcription en combinant l’information des profils d’expression et des positions des TSS. Plusieurs approches fondées sur les modèles de matrices poids-position (PWM) vont être explorées pour étendre le modèle de mélange classiquement utilisé en relâchant l’hypothèse selon laquelle les motifs correspondants aux différents sites de fixations apparaissent indépendamment dans les différentes régions promotrices. Dans les nouveaux modèles, nous prendrons explicitement en compte une probabilité supérieure d’apparition d’un même motif dans des promoteurs dont les profils d’activité sont similaires. Une attention particulière sera aussi portée à la position du motif par rapport au TSS et au site de fixation du facteur sigma. En parallèle des développements méthodologiques nous travaillerons aussi sur l’utilisation de ces approches pour reconstruire le réseau des régulations transcriptionnelles chez L. monocytogenes en s’appuyant sur les données de la littérature et du projet List MAPS. Enfin,nous envisageons d’utiliser l’information sur le réseau de régulation pour étudier un point particulier qui serait pertinent.