Reconstruire les trajectoires stochastiques d'évolution virale
Auteur / Autrice : | Marian Huot |
Direction : | Simona Cocco |
Type : | Projet de thèse |
Discipline(s) : | Physique |
Date : | Inscription en doctorat le 01/09/2023 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Physique en Île-de-France (Paris ; 2014-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Physique de l'École normale supérieure |
établissement opérateur d'inscription : Ecole normale supérieure |
Mots clés
Résumé
Les approches d'apprentissage automatique permettent de déduire les propriétés des protéines virales, notamment leur viabilité, directement à partir des séquences de protéines présentes dans la nature. Ces approches sont tout particulièrement rendues possibles grâce à la disponibilité d'une énorme quantité de données, telles que le serveur Gisaid (https://www.gisaid.org/), sur lequel plus de 8 millions de séquences de SARS-CoV-2 ont été collectées depuis le début de l'épidémie de Covid-19. En développant des modèles axés sur ces données, il est possible de faire des prédictions à la fois sur les propriétés, mais aussi l'évolution future de protéines virales. Plus précisément, le projet de thèse consistera en : 1-Développement de modèles de paysages de fitness pour les variants de SarsCov2, basés sur la mécanique statistique. Ces modèles permettront une exploration efficace du paysage mutationnel guidée par l'optimisation bayésienne. De telles méthodes visent à identifier à l'avance les variants les plus probables et dangereux, et à accélérer la conception de protocoles de vaccination optimaux. 2-Inférence de modèles reproduisant les contraintes agissant sur les séquences d'acides aminés des protéines virales clés et prédiction des mutations d'évasion (par exemple, augmentation de l'affinité de liaison ou évasion des vaccins dans la protéine de pointe de SarsCov2). 3-Développement de modèles évolutifs basés sur la théorie de la génétique des populations, dans lesquels la mutation, la recombinaison et la duplication virale sont explicitement pris en compte dans la dynamique évolutive des virus. Ces modèles seront également informés par les données expérimentales de notre collaborateur A. Komarova à l'Institut Pasteur. 4-Développement de modèles de chemins de transition dans le paysage de fitness inféré, comprenant une dynamique évolutive virale réaliste issue du modèle de génétique des populations développé ci-dessus. Ces modèles de chemins de transition seront également utilisés pour la reconstruction phylogénétique et comparés aux modèles phylogénétiques classiques.