Auteur / Autrice : | Sébastien Riquier |
Direction : | Farida Djouad, Thérèse Commes-Maerten |
Type : | Thèse de doctorat |
Discipline(s) : | Biologie Santé |
Date : | Soutenance le 04/02/2019 |
Etablissement(s) : | Montpellier |
Ecole(s) doctorale(s) : | Sciences Chimiques et Biologiques pour la Santé (Montpellier ; Ecole Doctorale ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Institut en médecine régénératrice et de biothérapie (Montpellier) |
Jury : | Président / Présidente : Louis Casteilla |
Examinateurs / Examinatrices : Farida Djouad, Thérèse Commes-Maerten, Louis Casteilla, Christine Gaspin, Charles-Henri Lecellier, Thomas Derrien, Pierre Charbord | |
Rapporteurs / Rapporteuses : Louis Casteilla, Christine Gaspin |
Mots clés
Résumé
Le développement du séquençage ARN, ou RNAseq, a permis l'essor de la recherche intensive de biomarqueurs dans de nombreux domaines de la biologie. L’information complète du transcriptome contenue dans les données de sorties, permet à un bioinformaticien assidu de dépasser les connaissances actuelles et d’accéder, grâce à des pipelines informatiques avancés, à d’innombrables signatures d’intérêts inédites. Dans cette thèse nous mettons en avant que ces marqueurs potentiels, essentiellement explorés pour répondre à des problématiques clinique en conditions pathologiques, peuvent être utilisés pour affiner la caractérisation de types de cellules sans marqueurs strictement spécifiques. Nous nous sommes intéressés aux cellules souches mésenchymateuses (MSCs), un type de cellules souches adultes multipotentes, fortement utilisées en clinique mais ne possédant pas de marqueurs positifs strictement spécifiques.Notre étude se concentre sur la recherche des ARN longs non-codants non annotés. Ces ARNs, aussi nommés "lncRNA", constituent une classe émergente de transcrits encore peu explorée à ce jour. De plus, cette catégorie démontre une spécificité conditionnelle et tissulaire élevée. Nous avons élaboré un pipeline d’analyse RNAseq optimisé pour la reconstruction et la quantification de lncRNAs non annotés.En utilisant les données publiques de RNAseq, venant de différentes sources de MSCs et d'autres types de cellules, nous avons identifié de nouveaux lncRNA non annotés exprimés spécifiquement dans les MSCs.Nous avons développé pour ce projet Kmerator.jl, un outil qui permet de décomposer un transcrit en sous séquences spécifiques (k-mers) afin de chercher et quantifier plus rapidement la signature de nos candidats dans un grand nombre de données RNAseq. Kmerator a également été utilisé dans d'autres applications pour tester la qualité des données RNA-seq disponibles en accés public.Après validation de ces nouveaux biomarqueurs de MSCs par qPCR, nous avons eu recours à plusieurs outils informatiques pour prédire leurs fonctions potentielles. Enfin, nous avons analysé des données RNAseq « single-cell » pour aborder l’hétérogénéité d’expression au sein des populations MSCs.