Développement de méthodes informatiques pour l'évaluation et l'amélioration de l'identification par spectrométrie de masse des peptides modifiés
Auteur / Autrice : | Albane Lysiak |
Direction : | Guillaume Fertin, Géraldine Jean, Dominique Tessier |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 06/12/2022 |
Etablissement(s) : | Nantes Université |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des Sciences du Numérique de Nantes - Biopolymères, Interactions, Assemblages BIA (Unité de recherche INRA - Université de Nantes) |
ANR : ANR DeepProt | |
Jury : | Président / Présidente : Thomas Burger |
Examinateurs / Examinatrices : Thierry Lecroq, Christine Carapito, Martial Rey | |
Rapporteurs / Rapporteuses : Thierry Lecroq, Christine Carapito |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La spectrométrie de masse (MS) est l’une des méthodes privilégiées pour identifier les protéines. Elles sont habituellement identifiées à partir de leurs peptides. Pour cela, les spectres obtenus à partir des peptides sont comparés à une base de données de spectres théoriques à l’aide d’un score de similarité, et les PSM (Peptide-Spectrum Matches) produits aident à l’identification des spectres. Cependant, la plupart des spectres générés ne peuvent pas être correctement identifiés. L’une des raisons est que les protéines, et donc les peptides résultants, portent des modifications, ce qui complexifie l’identification des spectres issus de ces peptides. Pour résoudre ce problème, les approches OMS (Open Mass Search) offrent des éléments prometteurs. Cependant ces méthodes sont encore confrontées à certains obstacles, surtout lorsque le peptide comporte des modifications inconnues. De plus, l’évaluation de leurs résultats est complexe. Dans le cadre de cette thèse, j’ai d’abord évalué des stratégies OMS à l’aide de spectres théoriques jouant le rôle de spectres expérimentaux, ce qui a permis de développer de nouveaux critères pour évaluer les PSM. À la suite de ce travail, j’ai développé SpecGlob, un algorithme qui repose sur la programmation dynamique pour aligner les masses contenues dans un PSM, afin d’identifier plusieurs modifications inconnues qui séparent le peptide qui a généré le spectre à identifier du peptide candidat.