Thèse soutenue

Génomique et épigénomique de l’immunité chez le haricot commun (Phaseolus vulgaris) : leçons tirées des assemblages de génomes à l'échelle du chromosome

FR  |  
EN
Auteur / Autrice : Juan Camilo Álvarez Díaz
Direction : Valérie GeffroyAriane Gratias-Weill
Type : Thèse de doctorat
Discipline(s) : Biologie
Date : Soutenance le 21/07/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences du végétal : du gène à l'écosystème (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut des sciences des plantes de Paris-Saclay (Gif-sur-Yvette, Essonne ; 2015-....)
Référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Biosphera (2020-….)
Jury : Président / Présidente : Karine Alix-Jenczewski
Examinateurs / Examinatrices : Jordi Garcia Mas, Mohammed Bendahmane, Nicolas Chen
Rapporteur / Rapporteuse : Jordi Garcia Mas, Mohammed Bendahmane

Résumé

FR  |  
EN

Le haricot commun (Phaseolus vulgaris) est la légumineuse à grains la plus importante pour la consommation humaine et la principale source de protéines dans de nombreux pays en développement. Au début de cette thèse, deux assemblages de génomes de haricot commun étaient disponibles : un pour le génotype andin G19833, un génome de référence de haute qualité disponible sur Phytozome, et un de moindre qualité pour le génotype méso-américain BAT93, classiquement étudié à l'IPS2. Même s'ils ne sont pas optimaux (G19833 n'étant pas notre génotype étudié et l'assemblage de BAT93 n'étant pas de haute qualité), ces deux génomes nous ont permis d'aborder des questions spécifiques. Tout d'abord, nous dévoilons les composants du silencing guidé par les ARN en profitant de la disponibilité de ces deux assemblages de génomes d'origine andine et méso-américaine. Nous avons identifié six PvDCLs, treize PvAGOs, 10 PvDRBs, 5 PvRDRs, dans les deux génotypes, ce qui suggère l'absence d'amplification ou de suppression récente de gènes après la séparation des pools géniques. De plus, même si l'assemblage du génome de BAT93 ne permet pas une analyse des séquences répétées, sa qualité est suffisante pour l'analyse des gènes. De plus, plusieurs des gènes candidats impliqués dans le silencing étaient induits après infection par le champignon Colletotrichum lindemuthianum, agent de l'anthracnose. Nous avons ensuite réalisé une analyse transcriptomique à l'échelle du génome pour voir les effets de l'infection par C. lindemuthianum sur le haricot, en prenant G19833 comme génome de référence. Nos résultats soulignent l'importance des protéines liées à la pathogénèse de la famille PR10/Bet vI dans la réaction de défense du haricot. Il est intéressant de noter que la différence entre la réaction compatible et incompatible est plus une question de temps et d'intensité de réponse, qu'une différence massive de gènes différentiellement exprimés entre ces deux contextes. Chez le haricot, des analyses précédentes ont montré que sur ~400 NLR, la classe majeure de gènes de résistance aux maladies chez les plantes, ~50% étaient méthylés dans les 3 contextes de séquence comme les éléments transposables (ET). Notre analyse transcriptomique a montré que ~30 NLR étaient induits après l'infection par C. lindemuthianum, mais seulement 3 d'entre eux ont été identifiés comme méthylés dans le contexte non infecté, ce qui suggère que l'activation des NLR ne correspond pas à une déméthylation. Au cours de mon doctorat, une révolution génomique a eu lieu, permettant à tout groupe de recherche de générer un assemblage génomique de haute qualité pour sa plante d'intérêt. Dans ce contexte, nous avons généré des assemblages génomiques à l'échelle du chromosome des génotypes BAT93 et JaloEEP558 (Andin) en utilisant le séquençage PacBio HiFi et les données de capture de conformation des chromosomes (Hi-C) pour l'assemblage du génome. Ces deux assemblages hautement contigus offrent une opportunité unique d'étudier l'évolution des séquences répétées telles que les NLR ainsi que les ADN satellites subtélomériques (Khipu) et centromériques (Nazca et CentPv2). D'importantes variations structurelles ont été observées pour ces séquences répétées. En ce qui concerne les NLR, des différences spectaculaires ont été observées pour plusieurs clusters tels que le cluster I de gènes de résistance, situé à une extrémité du chromosome 2: avec 1 NLR chez JaloEEP558 et 26 NLR chez BAT93. De façon inattendue, nous avons identifié un élément transposable inséré dans le gène NLR candidat I dans l'assemblage BAT93-HiFi que nous avons généré. Cet ET n'est pas présent dans ce même gène candidat dans d'autres ressources génomiques BAT93 disponibles (clones BAC et autres assemblages de BAT93), ce qui suggère une insertion récente de l'ET spécifiquement dans notre matériel à l'IPS2. En outre, un polymorphisme de méthylation a été observé entre les génotypes de haricot pour le NLR du cluster de résistance Co-2.