Thèse soutenue

Dans les abysses du transcriptome : découverte de nouveaux biomarqueurs de cellules souches mésenchymateuses par analyse approfondie du RNAseq
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Sébastien Riquier
Direction : Farida DjouadThérèse Commes-Maerten
Type : Thèse de doctorat
Discipline(s) : Biologie Santé
Date : Soutenance le 04/02/2019
Etablissement(s) : Montpellier
Ecole(s) doctorale(s) : Sciences Chimiques et Biologiques pour la Santé (Montpellier ; Ecole Doctorale ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut en médecine régénératrice et de biothérapie (Montpellier)
Jury : Président / Présidente : Louis Casteilla
Examinateurs / Examinatrices : Farida Djouad, Thérèse Commes-Maerten, Louis Casteilla, Christine Gaspin, Charles-Henri Lecellier, Thomas Derrien, Pierre Charbord
Rapporteurs / Rapporteuses : Louis Casteilla, Christine Gaspin

Résumé

FR  |  
EN

Le développement du séquençage ARN, ou RNAseq, a permis l'essor de la recherche intensive de biomarqueurs dans de nombreux domaines de la biologie. L’information complète du transcriptome contenue dans les données de sorties, permet à un bioinformaticien assidu de dépasser les connaissances actuelles et d’accéder, grâce à des pipelines informatiques avancés, à d’innombrables signatures d’intérêts inédites. Dans cette thèse nous mettons en avant que ces marqueurs potentiels, essentiellement explorés pour répondre à des problématiques clinique en conditions pathologiques, peuvent être utilisés pour affiner la caractérisation de types de cellules sans marqueurs strictement spécifiques. Nous nous sommes intéressés aux cellules souches mésenchymateuses (MSCs), un type de cellules souches adultes multipotentes, fortement utilisées en clinique mais ne possédant pas de marqueurs positifs strictement spécifiques.Notre étude se concentre sur la recherche des ARN longs non-codants non annotés. Ces ARNs, aussi nommés "lncRNA", constituent une classe émergente de transcrits encore peu explorée à ce jour. De plus, cette catégorie démontre une spécificité conditionnelle et tissulaire élevée. Nous avons élaboré un pipeline d’analyse RNAseq optimisé pour la reconstruction et la quantification de lncRNAs non annotés.En utilisant les données publiques de RNAseq, venant de différentes sources de MSCs et d'autres types de cellules, nous avons identifié de nouveaux lncRNA non annotés exprimés spécifiquement dans les MSCs.Nous avons développé pour ce projet Kmerator.jl, un outil qui permet de décomposer un transcrit en sous séquences spécifiques (k-mers) afin de chercher et quantifier plus rapidement la signature de nos candidats dans un grand nombre de données RNAseq. Kmerator a également été utilisé dans d'autres applications pour tester la qualité des données RNA-seq disponibles en accés public.Après validation de ces nouveaux biomarqueurs de MSCs par qPCR, nous avons eu recours à plusieurs outils informatiques pour prédire leurs fonctions potentielles. Enfin, nous avons analysé des données RNAseq « single-cell » pour aborder l’hétérogénéité d’expression au sein des populations MSCs.