Thèse soutenue

Annotation des génomes de paramécies

FR  |  
EN
Auteur / Autrice : Olivier Arnaiz
Direction : Linda Sperling
Type : Thèse de doctorat
Discipline(s) : Sciences de la vie et de la santé
Date : Soutenance le 27/11/2020
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Structure et dynamique des systèmes vivants (Gif-sur-Yvette, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut de biologie intégrative de la cellule (Gif-Sur-Yvette, Essonne ; 2015-....)
Référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
Jury : Président / Présidente : Gaëlle Lelandais
Examinateurs / Examinatrices : Stéphanie Bocs, Hugues Roest Crollius, Gilles Fischer, Olivier Jaillon, Hadi Quesneville
Rapporteur / Rapporteuse : Stéphanie Bocs, Hugues Roest Crollius

Résumé

FR  |  
EN

Les nouvelles technologies de séquençage (NGS) ont révolutionné nos approches de la génomique.De nombreux génomes d'organismes ont été séquencés et assemblés.Le décryptage de l'information qu'ils contiennent (annotation) est plus que jamais une étape cruciale.Dans ce manuscrit, je vais me focaliser sur l’impact qu'ont eu les NGS sur l'annotation des génomes de paramécies, et notamment l'annotation de gènes et d'éléments transposables (ET).La paramécie est un eucaryote unicellulaire possédant deux types de noyaux. Un noyau germinal (MIC) utilisé pour transmettre l'information génétique à la génération sexuelle suivante, et un noyau somatique (MAC) assurant l'expression des gènes.Les caractéristiques particulières des gènes de paramécies m'ont incité à développer une chaîne de procédures dédiée à leur annotation, utilisant des données ARN-seq.A chaque cycle sexuel, le MAC parental est perdu et un nouveau MAC est généré à partir d'un MIC impliquant des réarrangements programmés de génome et notamment de l'élimination d'ADN portant des ET et de petites séquences à copie unique appelées IES (Internal Eliminated Sequence). Nous avons développé le logiciel ParTIES, utilisant des données ADN-seq, pour identifier les ~45 000 IES du génome de Pararamecium tetraurelia et montré que les IES sont des reliques d'ET.Une série de trois duplications globales de génome (WGD) anciennes mais encore visible, pendant l'histoire évolutive de la lignée, nous a permis de décrire la dynamique d'invasion et d'évolution des ET à l'origine des IES.