Une approche de criblage et d'apprentissage pour la sécrétion de protéine chez la levure.
Auteur / Autrice : | Alicia Da Silva |
Direction : | Grégory Batt, Senta Heiss-blanquet |
Type : | Projet de thèse |
Discipline(s) : | Biotechnologies |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Agriculture, alimentation, biologie, environnement, santé (Paris ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Experimental and Computational Methods for Modeling Cellular Processes |
Référent : AgroParisTech |
Mots clés
Mots clés libres
Résumé
Les enzymes issues de la biodiversité constituent un énorme réservoir pour améliorer les cocktails de dégradation de la biomasse végétale ou pour trouver des enzymes pour la biologie synthétique. L'analyse de leur activité et leur caractérisation nécessitent néanmoins une expression dans des organismes hôte capables de les produire en quantité suffisante. Pour l'expression des enzymes eucaryotes, des levures comme Pichia pastoris ou Saccharomyces cerevisiae sont très souvent utilisées compte tenu de leur croissance rapide, la facilité de transformation et leur bonne capacité de sécrétion. Or, le succès de l'expression hétérologue dans ces organismes est aléatoire en fonction de la protéine à produire, et une stratégie employée pour optimiser la production d'une protéine peut ne pas s'appliquer à une autre. Il est donc nécessaire de mieux appréhender les paramètres influant sur la sécrétion et de disposer d'un moyen de produire des protéines variées d'une façon robuste. C'est pourquoi, dans la présente thèse, nous proposons de développer un outil de prédiction pour une sécrétion optimale. Dans un premier temps, l'impact des paramètres tels que l'utilisation préférentielle de codons, la nature du peptide signal et les facteurs impliqués dans le système de sécrétion sera évalué. Nous utiliserons comme cas d'étude 3 types d'enzymes impliquées dans la dégradation de la biomasse : des cellobiohydrolases de famille GH6, des xyloglucanase de famille GH74 et les LPMO. Des banques de 105 variants possédant des fonds génétiques différents, incluant l'invalidation ou la surexpression de 500 gènes cibles codant pour des facteurs de la voie de sécrétion, 10 peptides signaux et 20 encodage de la protéine à produire, seront construites pour différents représentants de chaque famille d'enzyme. Les banques seront criblées par la méthode « auto-growth » basée sur le couplage entre la sécrétabilité d'une protéine et la croissance de la souche. La population sera enrichie en souches possédant les meilleures capacités de sécrétabilité. Leur identification sera réalisée par séquençage profond de la bibliothèque complète à différents moments de la culture. Dans une seconde étape, une approche de machine learning sera utilisée dans le but de développer des modèles prédictifs des impacts des conditions de sécrétion pour une protéine donnée. Enfin, les enzymes seront produites dans des conditions optimales et sous-optimales pour vérifier le pouvoir prédictif du modèle, puis leur activité testée.