Thèse soutenue

L'analyse du génome et du transcriptome par des méthodes sans référence
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Yunfeng Wang
Direction : Daniel GautheretYang Du
Type : Thèse de doctorat
Discipline(s) : Sciences de la vie et de la santé
Date : Soutenance le 22/07/2021
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Structure et Dynamique des Systèmes Vivants
Partenaire(s) de recherche : Laboratoire : Institut de biologie intégrative de la cellule (Gif-Sur-Yvette, Essonne ; 2015-....)
référent : Faculté des sciences d'Orsay
Jury : Président / Présidente : Gaëlle Lelandais
Examinateurs / Examinatrices : Daniel Gautheret, Jiayin Wang, Nicolas Gilbert, Eric Bonnet, Aitor Gonzalez
Rapporteurs / Rapporteuses : Jiayin Wang, Nicolas Gilbert

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les comportements et les phénotypes des animaux sont en partie intégrés dans les molécules génétiques de la vie: l’ARN et l’ADN. En déchirant les informations cachées dans ces molécules, nous pouvons lever un voile sur les mystères de la biologie. Le séquençage de nouvelle génération (NGS) est un outil puissant pour décoder les molécules d’ADN et d’ARN à très grande échelle. Le NGS a considérablement élargi notre compréhension de tous les domaines de la biologie, de la biologie moléculaire à la génétique, la médecine, l’écologie et l’épidémiologie. Une pierre angulaire de l’analyse des données NGS est la comparaison avec un génome de référence. Bien que les scientifiques utilisent un génome de référence par espèce, la croissance explosive de la production de séquençage a remis en question ce point de vue en montrant que les séquences réelles d’ADN et d’ARN sont beaucoup plus diversifiées.Dans cette thèse, nous proposons de nouveaux protocoles bioinformatiques pour l’analyse NGS qui ne reposent pas sur une référence. Nos projets visent à exploiter la puissance des approches sans alignement pour découvrir de nouvelles variations dans les transcriptomes et les génomes du cancer dans des régions difficiles à cartographier ou des régions absentes du génome de référence. Nous avons appliqué cette stratégie pour découvrir de nouveaux événements liés au phénotype à partir de cohortes de cancer à grande échelle. Du point de vue de l’analyse du génome, nous avons découvert de nouvelles variantes récurrentes de patients atteints de cancer de la prostate. Sur la base de l’analyse du transcriptome, nous avons découvert des événements de non-référence avec une haute réplicabilité.Nous démontrons qu’un grand nombre de nouveaux événements pertinents pour les maladies peuvent être découverts sans alignement. Ces nouveaux événements non référencés ne néces-sitent pas de connaissance a priori du génome humain ou du transcriptome et présentent des valeurs pronostiques significatives et un potentiel de production de néoantigènes. De plus, ces nouveaux événements non référencés impliqués dans le risque de cancer pourraient orien-ter les biologistes vers de nouveaux mécanismes d’oncogenèse.