Thèse soutenue

Inférence statistique des réseaux de régulation de gènes chez Arabidopsis thaliana en réponse à l'élévation des teneurs en CO2 atmosphérique

FR  |  
EN
Auteur / Autrice : Océane Cassan
Direction : Antoine MartinSophie Lèbre
Type : Thèse de doctorat
Discipline(s) : Biologie des systèmes
Date : Soutenance le 13/12/2022
Etablissement(s) : Université de Montpellier (2022-....)
Ecole(s) doctorale(s) : École Doctorale GAIA Biodiversité, agriculture, alimentation, environnement, terre, eau (Montpellier ; 2015-...)
Partenaire(s) de recherche : Laboratoire : Développement et Amélioration des Plantes (Montpellier ; 2007-2011)
Jury : Président / Présidente : Philippe Nacry
Examinateurs / Examinatrices : Antoine Martin, Sophie Lèbre, Philippe Nacry, Andrea Rau, Etienne Delannoy, Nathalie Villa-Vialaneix, Céline Masclaux-Daubresse
Rapporteurs / Rapporteuses : Andrea Rau, Etienne Delannoy

Résumé

FR  |  
EN

L'activité humaine provoque une élévation des niveaux de CO2 dans l'atmosphère, qui devraient passer de 420 ppm à environ 1000 ppm d'ici la fin du siècle. Les plantes en C3, qui constituent une grande partie des plantes cultivées, sont particulièrement touchées par l'augmentation des niveaux de CO2. Bien que l'on s'attende à une stimulation de la production de biomasse dans des conditions de CO2 élevé (eCO2), ce gain s'accompagne d'un appauvrissement marqué de la composition minérale des plantes et d'une diminution particulièrement forte de leur teneur en azote (N). Cela constitue une menace majeure pour la nutrition humaine, que nous proposons de commencer à traiter par des approches de biologie des systèmes. Les hypothèses prometteuses pour expliquer ce déclin invoquent une perturbation des voies de signalisation associées à l'absorption et à l'assimilation de l'azote, ce qui motive l'étude à l'échelle génomique de la reprogrammation de l'expression des gènes dans les racines de la plante modèle Arabidopsis thaliana sous eCO2. Pour découvrir les régulateurs inconnus qui orchestrent ces réseaux, nous avons développé des méthodes statistiques pour l'inférence des réseaux de régulation de gènes (GRN), une tâche entravée par la grande dimension et la rareté des réseaux validés. La modélisation des dépendances transcriptionnelles à partir de données d'expression peut être réalisée par des techniques de régression, en supposant que les variations d'expression des gènes régulateurs ont un pouvoir descriptif et prédictif sur les variations d'expression de leurs cibles. Nous proposons deux nouvelles approches : (i) une extension d'une méthode basée sur les forêts aléatoires, GENIE3, via des procédures par permutation évaluant la significativité des interactions de régulation que nous incluons dans une suite complète pour l'inférence GRN, et (ii) deux méthodes d'inférence GRN intégratives basées sur la régression linéaire sparse avec sélection de stabilité et sur les forêts aléatoires, intégrant les sites de fixation des facteurs de transcription (TFBS) aux données d'expression. Nous comparons ces méthodes à des gold-standards expérimentaux et montrons qu'elles améliorent la pertinence biologique des GRN inférés chez Arabidopsis thaliana. Nous avons appliqué la première approche d'inférence à un jeu de données transcriptomiques combinatoires de tissus racinaires dans des conditions nutritionnelles et des niveaux de CO2 contrastés, et la seconde aux racines de plantes exposées à un gradient de concentrations de CO2. Les GRNs inférés ont fourni des gènes candidats pour le contrôle de cette réponse, et nous démontrons que certains d'entre eux régulent la stimulation de la croissance sous eCO2 sans pénaliser la teneur en nutriments des pousses. Globalement, nos résultats indiquent que les gènes clés de la nutrition en nitrate et en fer et leurs régulateurs connus sont mal régulés par l'augmentation du CO2, et que les voies associées aux systèmes de transport de nitrate à haute affinité sont particulièrement altérées. Le dernier objectif de ce travail était de tirer parti de la variabilité génétique naturelle pour identifier les gènes contrôlant la réponse de l'ionome à l'eCO2. Nous avons confirmé une baisse du contenu minéral dans trois populations d'Arabidopsis à différentes échelles géographiques, et montré que la variabilité de cette réponse peut être expliquée par des déterminants génétiques dans le panel mondial via des modèles linéaires mixtes. Nous avons mis en avant un autre ensemble de gènes candidats, fortement associés à l'appauvrissement en fer, N et zinc dans les pousses sous eCO2, qui ouvrent la voie à la conception de plantes à valeur nutritionnelle durable pour le futur proche.