Thèse de doctorat en Sciences végétales
Sous la direction de Moussa Benhamed.
Soutenue le 16-12-2022
à université Paris-Saclay , dans le cadre de École doctorale Sciences du Végétal : du gène à l'écosystème , en partenariat avec Faculté des sciences d'Orsay (référent) , Université Paris-Saclay. Graduate School Biosphera (2020-....) (graduate school) et de Institut des sciences des plantes de Paris-Saclay (Gif-sur-Yvette, Essonne ; 2015-....) (laboratoire) .
Le président du jury était Florian Frugier.
Le jury était composé de Aline Probst, Mohamed Bendahmane, Hélène Neyret-Kahn, Olivier C. Martin.
Les rapporteurs étaient Aline Probst, Mohamed Bendahmane.
L'avènement des nouvelles technologies de séquençage puis du séquençage longues lectures a ouvert la voie vers la production de génomes de référence à un coût abordable. Les outils bioinformatiques, tout comme les techniques de laboratoire, ne cessent d'évoluer et il est important de tester et mettre en place toutes ces technologies de pointe.Ce mémoire de thèse présente, au travers de différentes publications, les développements méthodologiques mis en place dans le cadre d'assemblages de génomes de référence. Les longues lectures obtenues grâce au séquençage avec la technologie Oxford Nanopore nous ont permis d'améliorer la continuité de nos assemblages et de reconstituer plus fidèlement des régions souvent invisibles avec des méthodes traditionnelles, notamment les régions contenant des séquences répétées ou des clusters de gènes dupliqués. La technologie de carte optique proposée par Bionano Genomics, et le séquençage de banques Hi-C nous ont permis d'amener nos assemblages à l'échelle des chromosomes et d'accéder à la structure de régions dites complexes comme les centromères.J'ai pu mettre en évidence l'importance de ces nouveaux assemblages pour différents génomes de plantes, pour lesquels ils constituent une ressource très précieuse pour de futures recherches sur l'histoire évolutive des espèces, sur les adaptations à de nouvelles conditions de vie ou sur les gènes de résistance aux pathogènes.Ces développements vont être adaptés pour répondre aux besoins de nouveaux projets de production de génomes de référence à grande échelle et dont le but est de préserver l'information génétique de la biodiversité.
Bioinformatics approaches for genome and biodiversity exploration
The emergence of new sequencing technologies, as long-read sequencing, has paved the way for the production of reference genomes at an affordable cost. Bioinformatics tools, as well as laboratory techniques, are constantly evolving and it is important to test and implement state-of-the-art technologies.This thesis presents, through different publications, the methodological developments implemented in the framework of reference genome assemblies. The long reads obtained using the Oxford Nanopore sequencing technology allowed us to improve the contiguity of our assemblies and to accurately reconstruct regions that were resistant to older sequencing technologies, as regions containing repeated sequences or clusters of duplicated genes. The optical map technology proposed by Bionano Genomics and the sequencing of Hi-C libraries, allowed us to produce assemblies at the chromosome scale and to access the structure of complex regions such as centromeres.I have been able to demonstrate the importance of these enhanced assemblies with different plant genomes, for which they provide a valuable resource for future research on evolutionary history, adaptations to new living conditions or resistance genes.These developments will be adapted to meet the needs of future large-scale projects aimed at producing reference genome and preserving the genetic information of biodiversity.
Il est disponible au sein de la bibliothèque de l'établissement de soutenance.