Thèse en cours

Cartographie et ingénierie de l'affinité de liaison et de la spécificité des anticorps

FR  |  
EN
Auteur / Autrice : Matilde Pattanaro
Direction : Clément NizakOlivier Rivoire
Type : Projet de thèse
Discipline(s) : Physique
Date : Inscription en doctorat le 01/10/2024
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : Physique en Ile de France
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Perrin

Résumé

FR  |  
EN

Résumé: Nous nous interrogeons sur la relation entre la séquence protéique et la fonction protéique en utilisant les anticorps comme système modèle. Pour ce faire, nous développons une approche basée sur des expériences in vitro à haut débit, associées à des analyses de données et à la modélisation (modèles physiques et apprentissage automatique). La structure des anticorps issus d'un répertoire se compose d'une boucle de surface hautement diversifiée, susceptible de se lier à des antigènes très variés, et d'une charpente sous-jacente moins diversifiée. En combinant le phage display et le séquençage à haut débit de l'ADN, nous mesurons l'affinité de liaison d'anticorps synthétiques à des antigènes cibles. Nous commencerons par modéliser statistiquement la relation « séquence de boucle-affinité » afin de prédire de nouveaux anticorps avec des spécificités de liaison sur mesure. Ensuite, nous étendrons l'analyse et la modélisation des données statistiques pour dévoiler comment la boucle de surface est couplée à la charpente, et pour cartographier les contributions à l'affinité de liaison et à la stabilité thermique au sein des séquences d'anticorps. Enfin, nous analyserons comment la réponse à la sélection et à l'évolution (potentiel de sélection, évolvabilité) des répertoires dépend de la stabilité thermique de la charpente. Projet de doctorat: Notre projet aborde le problème de la relation séquence-fonction dans les protéines en utilisant les anticorps comme système modèle. Cette question concerne l'immunité adaptative ainsi que les origines évolutives de cet important composant de la réponse immunitaire des vertébrés. Elle est également d'un grand intérêt dans le domaine de l'ingénierie des protéines, comme en témoigne le prix Nobel de chimie 2018, avec de nombreuses applications dans l'industrie pharmaceutique. La structure des régions variables des anticorps (qui définissent leur affinité de liaison et leur spécificité) consiste en des boucles de surface en contact direct avec les antigènes cibles et des régions de cadre sous-jacentes. La grande diversité de séquences des régions variables des anticorps est un élément clé de la réponse immunitaire adaptative, car elle permet aux répertoires d'anticorps de posséder des potentiels de liaison à une diversité immense d'antigènes cibles. Cette diversité résulte d'abord de la recombinaison de segments de séquence déterminés génétiquement. De plus, la séquence d'une des boucles, appelée VH-CDR3, présente de loin le plus haut niveau de diversité car elle est également partiellement générée par un processus aléatoire se produisant à la jonction entre les segments. Nous définissons comme ''charpente'' des régions variables d'anticorps la partie génétiquement codée de leur séquence, c'est-à-dire les régions de cadre et une partie des boucles de surface, et comme ''boucle CDR3'' la partie somatiquement définie du VH-CDR3 (typiquement 4-6 acides aminés). Étant donné que la boucle CDR3 est la plus diversifiée, elle est généralement considérée comme ayant la principale contribution à l'affinité de liaison et à la spécificité pour des antigènes très divers. Cependant, la liaison n'est pas entièrement déterminée par la boucle CDR3. Le couplage entre la boucle CDR3 et la charpente a été largement documenté, les mutations des régions de cadre affectant la conformation des boucles et donc l'affinité de liaison, ce qui a un impact important lors de la maturation de l'affinité (impliquant des mutations dans l'ensemble de la région variable). De plus, les applications des anticorps thérapeutiques nécessitent généralement une ingénierie empirique en raison de ce couplage. Relier la séquence des anticorps à la liaison nécessite donc de considérer les acides aminés des régions variables au-delà de la boucle CDR3. Au cours des 10 dernières années, une nouvelle approche a été développée pour aborder ce problème en utilisant le séquençage à haut débit des répertoires d'anticorps pour construire des modèles statistiques qui prédisent l'affinité à partir des données de séquence uniquement. Les technologies à cellule unique produisent de telles données de séquence et phénotypiques à grande échelle sur les répertoires immunitaires naturels, mais avec des limitations importantes pour la modélisation mathématique, les forces de sélection agissant in vivo n'étant pas contrôlées et difficiles à caractériser. De plus, les diversités des répertoires naturels dépassent les capacités actuelles de séquençage de l'ADN. Une alternative consiste à réaliser des expériences de sélection/maturation de l'affinité in vitro dans des conditions contrôlées sur des répertoires d'anticorps synthétiques en utilisant le phage display avec lecture de séquençage de l'ADN à haut débit, ce qui surmonte ces limitations. En couplant des méthodes et des concepts issus de la physique statistique/apprentissage automatique, les données de haute qualité de ces expériences in vitro peuvent être utilisées pour prédire des séquences avec des fonctions améliorées ou pour décomposer un phénotype de séquence en différents composants physiques, par exemple, l'affinité de liaison et la stabilité thermique, comme démontré dans le cas d'un autre type de protéine de liaison. Nous développons cette approche dans le contexte des anticorps pour répondre à plusieurs questions ouvertes : 1) Comment prédire l'affinité de liaison à partir des séquences de la boucle CDR3? 2) Comment prédire le couplage boucle CDR3-charpente? 3) Comment identifier les charpentes d'anticorps les plus propices à la sélection et à la maturation de l'affinité? 4) Comment relier ce potentiel de maturation des charpentes (ici appelé évolvabilité) à des propriétés biophysiques telles que la stabilité thermique? Dans des travaux précédents, nous nous sommes concentrés sur (3) et avons démontré comment une approche statistique peut identifier des charpentes d'anticorps avec des potentiels de sélection accrus. Actuellement, nous finalisons un travail qui résout (1) en utilisant des bibliothèques d'anticorps avec des « boucles CDR3 » randomisées sur 4 acides aminés en adaptant les algorithmes de nos collaborateurs. Nous avons également produit des données expérimentales avec des séquences d'anticorps qui sont mutées aléatoirement sur toute leur séquence (imitant les mutations lors de la maturation de l'affinité) pour aborder (2) dans le cadre du projet de l'un de nos doctorants actuels. Notre objectif dans les années à venir est d'exploiter et d'étendre nos résultats passés et de nouvelles données pour résoudre conjointement les questions (2) et (4). Nous prévoyons de procéder comme suit, dans le cadre du programme i-Bio : 1) Étendre notre modélisation actuelle à nos nouvelles données sur des répertoires plus diversifiés, voir rotation ci-dessous. 2) Montrer comment nous pouvons appliquer des méthodes statistiques développées par d'autres pour inférer une cartographie entre la séquence et à la fois l'affinité de liaison et la stabilité thermique, à partir de nos données de sélection dans lesquelles les anticorps sont mutés aléatoirement sur toute leur séquence. C'est le projet actuel de l'un de nos doctorants. Les prédictions doivent être vérifiées par un test expérimental sur la stabilité thermique. Contribuer au développement d'un tel test constituerait la première partie de la thèse, y compris la calibration avec des mesures standard de stabilité des protéines. Les résultats de ce travail devraient mener à une première publication significative. 3) Analyser avec cette combinaison d'expériences et de modélisation statistique les charpentes d'anticorps que nous avons identifiées comme ayant des potentiels de sélection différents et tester l'hypothèse que ces différences sont associées à des différences de stabilité thermique. Ce serait la deuxième partie d'un projet de thèse où l'étudiant combinerait les méthodes computationnelles apprises lors de la rotation et les méthodes expérimentales développées pendant la première partie de la thèse pour mener de manière autonome un nouveau projet. Approches expérimentales et/ou théoriques: Notre approche expérimentale combine le phage display pour anticorps et le séquençage d'ADN à haut débit (Illumina) appliqués à des répertoires d'anticorps synthétiques conçus sur mesure. Ces outils sont bien établis dans notre groupe. Pour ce projet, nous mettrons en place un test de stabilité des anticorps à grande échelle en adaptant une méthode publiée basée sur le phage display au format Fab, qui nécessite un repliement correct des domaines VH et VL pour leur association adéquate. Notre approche théorique combine la physique statistique et l'apprentissage automatique pour déduire les paramètres de modèles physiques interprétables à partir des données à haut débit générées expérimentalement. Pour ce projet, nous développerons des méthodes que nous et d'autres avons précédemment appliquées aux anticorps ainsi qu'à d'autres protéines.