Thèse soutenue

Développement de méthodes bioinformatiques pour l'analyse de collections massives de motifs de liaison pour des facteurs transcriptionnels : enrichissement local et clustering de motifs

FR  |  
EN
Auteur / Autrice : Jaime Castro-Mondragon
Direction : Jacques Van Helden
Type : Thèse de doctorat
Discipline(s) : Génomique et Bioinformatique
Date : Soutenance le 13/07/2017
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole Doctorale Sciences de la Vie et de la Santé (Marseille)
Partenaire(s) de recherche : Laboratoire : TAGC. Technological advances for genomics and clinics (marseille)
Jury : Président / Présidente : Pedro Maldonado Coutinho
Examinateurs / Examinatrices : Sophie Gerard-Chantalat, Giacomo Cavalli
Rapporteurs / Rapporteuses : Stein Aerts, Philipp Bücher

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les facteurs transcriptionnels (TF) sont des protéines qui contrôlent l'expression des gènes. Leurs motifs de liaison (TFBM, également appelés motifs) sont généralement représentés sous forme de matrices de scores spécifiques de positions (PSSM). L'analyse de motifs est utilisée en routine afin de découvrir des facteurs candidats pour la régulation d'un jeu de séquences d'intérêt. L'avénement des méthodes à haut débit a permis de détecter des centaines de motifs, qui sont disponibles dans des bases de données. Durant ma thèse, j'ai développé deux nouvelles méthodes et implémenté des outils logiciels pour le traitement de collections massives de motifs: matrix-clustering regroupe les motifs par similarité; position-scan détecte les motifs présentant des préférences de position relativement à une coordonnée de référence. Les méthodes que j'ai développées ont été évaluées sur base de cas d'études, et utilisées pour extraire de l'information interprétable à partir de différents jeux de données de Drosophila melanogaster et Homo sapiens. Les résultats démontrent la pertinence de ces méthodes pour l'analyse de données à haut débit, et l'intérêt de les intégrer dans des pipelines d'analyse de motifs.