Efficient algorithms for de novo assembly of alternative splicing events from RNA-seq data

Gustavo Akio Tominaga Sacomoto

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Algorithmes efficaces pour l’assemblage de novo d’événements d’épissage alternatif dans des données de RNA-seq

FR |

EN

Auteur / Autrice :	Gustavo Akio Tominaga Sacomoto
Direction :	Marie-France Sagot, Pierluigi Crescenzi, Vincent Lacroix
Type :	Thèse de doctorat
Discipline(s) :	Bioinformatique
Date :	Soutenance le 06/03/2014
Etablissement(s) :	Lyon 1
Ecole(s) doctorale(s) :	École doctorale Evolution Ecosystèmes Microbiologie Modélisation (Lyon ; 1999-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire de Biométrie et Biologie Evolutive - Laboratoire de Biométrie et Biologie Evolutive
Jury :	Président / Présidente : Céline Brochier-Armanet
	Examinateurs / Examinatrices : Vincent Lacroix, Thierry Lecroq
	Rapporteurs / Rapporteuses : Michael Brudno, Roderic Guigo, Peter Widmayer

Mots clés

FR |

EN

Mots clés contrôlés

Analyse combinatoire énumérative

Épissage alternatif

Structures de données (informatique)

Algorithmes

Mots clés libres

Résumé

FR |

EN

Dans cette thèse, nous abordons le problème de l'identification et de la quantification de variants (épissage alternatif et polymorphisme génomique) dans des données de RNA-seq sans génome de référence, et sans faire un assemblage complet des transcripts. Basé sur l'idée que chaque variant correspond à un motif reconnaissable, qu'on appelle une bulle, dans un graphe de Bruijn construit à partir des lectures de RNA-seq, nous proposons un modèle pour les variants dans de tels graphes. Nous introduisons ensuite une méthode, appelé KisSplice, pour extraire les événements d'épissage alternatif, et nous montrons qu'il trouve plus d'événements corrects que les assembleurs de transcriptome traditionnels. Afin d'améliorer son temps d'exécution, nous proposons un nouvel algorithme polynomial pour énumérer les bulles. On montre qu'il est plusieurs ordres de grandeur plus rapide que les approches précédentes. Afin de réduire sa consommation en mémoire, nous proposons une nouvelle façon de représenter un graphe de Bruijn. Nous montrons que notre approche utilise 30% à 40% moins de mémoire que l'état de l'art. Nous appliquons les techniques développées pour énumérer les bulles à deux problémes classiques. Nous donnons le premier algorithme optimal pour énumérer les cycles dans des graphes non orientés. Il s'agit de la première amélioration à ce probléme en près de 40 ans. Nous considérons ensuite une variante du problème des K chemins plus courts: au lieu de limiter le nombre des chemins, nous limitons leurs poids. Nous présentons de nouveaux algorithmes qui utilisent exponentiellement moins mémoire que les approches précédentes

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Algorithmes efficaces pour l’assemblage de novo d’événements d’épissage alternatif dans des données de RNA-seq

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Algorithmes efficaces pour l’assemblage de novo d’événements d’épissage alternatif dans des données de RNA-seq

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses