Thèse soutenue

Méthodes informatiques pour la reconnaissance des protéines : application à la prédiction de la O-GlcNAcylation et aux interactions du SARS-CoV-2

FR  |  
EN
Auteur / Autrice : Théo Mauri
Direction : Marc Lensink
Type : Thèse de doctorat
Discipline(s) : Aspects moléculaires et cellulaires de la biologie
Date : Soutenance le 16/12/2022
Etablissement(s) : Université de Lille (2022-....)
Ecole(s) doctorale(s) : École doctorale Biologie-Santé (Lille ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Unité de glycobiologie structurale et fondamentale (UGSF)
Jury : Président / Présidente : Christophe Biot
Examinateurs / Examinatrices : Caroline Smet-Nocca, Stéphanie Olivier, Tony Lefebvre
Rapporteurs / Rapporteuses : Raphaël Guerois, Sophie Sacquin-Mora

Résumé

FR  |  
EN

Les interactions entre les protéines sont l'une des bases du développement de la vie. Leur identification et compréhension sont toujours des éléments majeurs de la recherche fondamentale et appliquée. Dans cette optique, on s'intéresse aux modifications post-traductionnelles des protéines qui ont la capacité d'altérer leur efficacité et leur durée de vie. Les interactions spécifiques entre protéines sont désormais étudiées au niveau atomique grâce au développement des méthodes expérimentales pour résoudre des structures de complexes protéiques. Cependant, ces méthodes ne permettent toujours pas d'obtenir les résultats escomptés et leur coût, que ce soit financier ou en termes de temps, peut empêcher la compréhension de certains phénomènes, notamment lors d'émergence de crise sanitaire comme le COVID-19. C'est pourquoi, en parallèle, des méthodes informatiques telles que l'amarrage moléculaire ou la dynamique moléculaire ont été développées. Cette thèse se situe dans ces deux contextes: dans un premier temps, la prédiction de sites de O-GlcNAcylation, une modification post-traductionnelle, catalysée par une seule enzyme appelée OGT, très étudiée qui est impliquée dans différentes maladies telles que le cancer, la maladie d'Alzheimer et le diabète de type 2. Dans un second temps, et ceci dans le contexte du COVID-19, des interactions entre les protéines humaines et virales ont été mises en avant mais avec la montée rapide de cas d'infection et les méthodes expérimentales étant trop longues, une expérimentation mondiale appelée CAPRI a proposé plusieurs des ces interactions aux modélisateurs du monde entier.La prédiction de sites de O-GlcNAcylation n'est pas une recherche récente car des outils proposent déjà cette possibilité. Afin de les comparer, une base de données a été créée pour les différencier. Comme les différents logiciels montraient un trop grand nombre de faux positifs, une amélioration basée sur cette plus grande base de données mais aussi sur des caractéristiques structurelles a été proposée. Malgré cela, les résultats montrent une trop grande hétérogénéité pour permettre une prédiction sûre. Des résultats supplémentaires appuient la théorie du besoin de protéines auxiliaires pour permettre à l'enzyme la reconnaissance de son substrat. Afin de mieux comprendre les mécanismes de cette modification, l'interaction entre la beta-caténine et l'OGT a été étudiée spécifiquement. En effet, cette interaction a été montrée comme étant impliquée dans le cancer colorectal et révèle donc un intérêt particulier.Pour établir la véracité des modèles proposés pour les interactions entre les protéines du SARS-CoV-2 et de l'humain, une méthode basée sur le consensus de tous les modèles produits a été développée. Au vu des premiers résultats, cette méthode semblait performante. C'est pourquoi sa capacité de prédiction a été testée sur une nouvelle grande base de données, fournie par CAPRI. Une fois encore, la méthode développée a montré de bons résultats. Elle a ensuite été comparée aux logiciels de scoring actuels et montre ici de meilleurs résultats. Hélas, cette méthode montre que les modèles d'interaction entre les protéines virales et humaines ne sont pas aussi fiables que souhaités.