A probabilistic approach for genome assembly from high-throughput chromosome conformation capture data
Auteur / Autrice : | Hervé Marie-Nelly |
Direction : | Christophe Zimmer, Romain Koszul |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance en 2013 |
Etablissement(s) : | Paris 6 |
Jury : | Président / Présidente : Frédéric Devaux |
Rapporteurs / Rapporteuses : Claude Thermes, Hugues Roest Crollius |
Mots clés
Résumé
Les approches modernes de séquençage d’adn ne permettent pas la lecture de fragments de plus de quelques kb. De ce fait, ont été développés des méthodes algorithmique permettant de former de plus grandes séquences ˆ partir de ces petits fragments. Nous avons développé une nouvelle méthodologie d’assemblage de génome basée sur le HiC. Le HiC est une procédure biochimique permettant l’inférence de la structure tridimensionelle d’un génome. Basée sur des probabilités bayesienne, notre méthode inverse le flux logique d’analyse de ces données. A partir des données 3D nous pouvons détecter et corriger les erreurs d’assemblages. Après avoir décrit le cadre mathématiques de la méthode, nous décrirons les résultats préliminaires obtenus sur des données simulées ainsi que des données expérimentales. En particulier nous montrerons une application concluante de la méthode sur le génome, encore non assemblé de trichoderma reesei, un champignon utilisé dans l’industrie énergÉtique.