Nouvelles approches de quantification des variations du protéome au niveau des protéines intactes : analyses expérimentales et computationnelles
Auteur / Autrice : | Nicolas Sénécaut |
Direction : | Jean-Michel Camadro, Gaëlle Lelandais |
Type : | Thèse de doctorat |
Discipline(s) : | Génétique, omiques, bioinformatique et biologie des systèmes |
Date : | Soutenance le 22/06/2022 |
Etablissement(s) : | Université Paris Cité |
Ecole(s) doctorale(s) : | École doctorale Frontières de l'innovation en recherche et éducation (Paris ; 2006-....) |
Partenaire(s) de recherche : | Laboratoire : Institut Jacques Monod (Paris ; 1997-....) |
Jury : | Président / Présidente : Fernando Rodrigues-Lima |
Examinateurs / Examinatrices : Fernando Rodrigues-Lima, Emmanuelle Leize-Wagner, Willy Vincent Bienvenut, Denis Mestivier | |
Rapporteur / Rapporteuse : Emmanuelle Leize-Wagner, Willy Vincent Bienvenut |
Mots clés
Résumé
La spectrométrie de masse à haute sensibilité et à haute résolution est un outil de mesure idéal permettant de décrire qualitativement et quantitativement, la dynamique et les variations de la composition du protéome. La complexité des spectres de masse produits s'explique par la présence d'isotopes dans les molécules biologiques analysées. Le « Simple Light Isotope Metabolic labeling » (SLIM), est une méthode de protéomique quantitative précédemment développée au laboratoire, au cours de laquelle la composition isotopique des protéines est modulée in vivo, par apport d'une source de carbone uniformément marquée au 12C qui permet la synthèse des acides aminés et donc des protéines ne contenant que du 12C. Durant cette thèse nous avons optimisé la version « Bottom-up » de la méthode SLIM par le développement d'un workflow automatique de traitement des données brutes, utilisant des méthodes algébriques permettant la modélisation des clusters isotopiques théoriques. Une description quantitative fine de chaque peptide est obtenue en mesurant le rapport entre les intensités isotopiques expérimentales et théoriques. Les valeurs quantitatives obtenues ont été validées expérimentalement par la comparaison de deux protéomes issus de souches de levure proches. L'observation des variations d'abondance des protéines marqueurs d'auxotrophies, démontre la sensibilité de la méthode. En complément de l'usage d'outils OpenSource et performants, nous avons produit un deuxième workflow similaire dont l'utilisation de ressources informatiques propriétaires (logiciel Proteome Discoverer) a été mis en œuvre dans le but d'optimiser l'extraction des intensités expérimentales des isotopologues dans les clusters isotopiques. Ce sont des données expérimentales critiques pour notre méthode de quantification. Nous avons par ailleurs développé des méthodes statistiques robustes dont l'objectif est d'évaluer et d'estimer le taux de fausses découvertes dans les résultats obtenus. Nous avons également adapté les méthodes de résolutions algébriques permettant la quantification dans l'éventualité de marquage incomplet des protéines, comme lors de l'étude d'organismes présentant des auxotrophies (les lignées cellulaires humaines). De manière analogue, une preuve de faisabilité de marquage indirect a été développée avec le nématode, ouvrant ainsi les perspectives pour des applications futures de la méthodes SLIM dans des sujets impliquant des organismes eucaryotes supérieurs. Le développement au préalable du bSLIM en Bottom-up nous a permis d'aborder les difficultés rencontrées lors de l'observation par spectrométrie de masse au niveau des protéines intactes (approches Top-down). En effet, la masse élevée de ces objets biologiques pose plusieurs contraintes techniques et technologiques, la principale étant qu'à cette échelle de masse, le nombre d'isotopes lourds dans les molécules est très grand. Les clusters isotopiques observés dans les spectres expérimentaux présentent donc une faible intensité de l'ion monoisotopique, rendant d'autant plus difficile sa mesure. C'est pourquoi nous avons développé une solution utilisant la distribution de Poisson de l'intensité des isotopologues dans chaque massif isotopique comme modèle théorique, pour décrire les clusters isotopiques en tSLIM, ce qui permet la quantification des protéines intactes. Le développement d'outils dédiés de traitement des données nous a permis de développer une méthode originale d'identification en top-down permettant, en plus de la quantification, la caractérisation des protéoformes.