Développement de méthodes bioinformatiques pour l'analyse de collections massives de motifs de liaison pour des facteurs transcriptionnels : enrichissement local et clustering de motifs
Auteur / Autrice : | Jaime Castro-Mondragon |
Direction : | Jacques Van Helden |
Type : | Thèse de doctorat |
Discipline(s) : | Génomique et Bioinformatique |
Date : | Soutenance le 13/07/2017 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | Ecole Doctorale Sciences de la Vie et de la Santé (Marseille) |
Partenaire(s) de recherche : | Laboratoire : TAGC. Technological advances for genomics and clinics (marseille) |
Jury : | Président / Présidente : Pedro Maldonado Coutinho |
Examinateurs / Examinatrices : Sophie Gerard-Chantalat, Giacomo Cavalli | |
Rapporteurs / Rapporteuses : Stein Aerts, Philipp Bücher |
Mots clés
Mots clés contrôlés
Résumé
Les facteurs transcriptionnels (TF) sont des protéines qui contrôlent l'expression des gènes. Leurs motifs de liaison (TFBM, également appelés motifs) sont généralement représentés sous forme de matrices de scores spécifiques de positions (PSSM). L'analyse de motifs est utilisée en routine afin de découvrir des facteurs candidats pour la régulation d'un jeu de séquences d'intérêt. L'avénement des méthodes à haut débit a permis de détecter des centaines de motifs, qui sont disponibles dans des bases de données. Durant ma thèse, j'ai développé deux nouvelles méthodes et implémenté des outils logiciels pour le traitement de collections massives de motifs: matrix-clustering regroupe les motifs par similarité; position-scan détecte les motifs présentant des préférences de position relativement à une coordonnée de référence. Les méthodes que j'ai développées ont été évaluées sur base de cas d'études, et utilisées pour extraire de l'information interprétable à partir de différents jeux de données de Drosophila melanogaster et Homo sapiens. Les résultats démontrent la pertinence de ces méthodes pour l'analyse de données à haut débit, et l'intérêt de les intégrer dans des pipelines d'analyse de motifs.