Thèse soutenue

Apprentissage automatique des interactions du répertoire immunitaire
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Giulio Isacchini
Direction : Aleksandra WalczakThierry MoraArmita Nourmohammad
Type : Thèse de doctorat
Discipline(s) : Physique
Date : Soutenance le 28/09/2021
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Physique en Île-de-France (Paris ; 2014-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de physique de l'ENS (Paris ; 2019-....)
établissement de préparation de la thèse : École normale supérieure (Paris ; 1985-....)
Jury : Président / Présidente : Rob J. de Boer
Examinateurs / Examinatrices : Aleksandra Walczak, Thierry Mora, Armita Nourmohammad, Rob J. de Boer, Philip H. Bradley, Anne-Florence Bitbol
Rapporteurs / Rapporteuses : Philip H. Bradley

Résumé

FR  |  
EN

Les lymphocytes T et B s’appuient sur la diversité des séquences de leurs récepteurs pour reconnaître les antigènes. Le répertoire de ces récepteurs immunitaires est généré par un processus de recombinaison V(D)J et est ensuite sélectionné pour augmenter l’affinité antigénique et éviter l’auto-immunité. Grâce aux développements des technologies de séquençage à haut débit, nous avons accès à une grande quantité de séquences de récepteurs du répertoire d’individus sains et malades. Afin d’utiliser les données de séquençage du répertoire immunitaire comme biomarqueur de maladies, nous devons développer un modèle neutre précis pour le répertoire de personnes en bonne santé. Ce modèle doit caractériser les processus de génération et de sélection des cellules pendant la maturation. Les modèles biophysiques de recombinaison des chaînes de récepteurs ont montré qu’ils capturaient bien les statistiques du répertoire avant la sélection. Cependant, lorsque nous déduisons des modèles linéaires simples de sélection, la probabilité post-sélection résultante est faiblement corrélée avec la répartition observée des récepteurs au sein d’un grand groupe d’individus. Dans cette thèse, nous appliquons une approche de maximum de vraisemblance à l’estimation de ratios de densités de probabilités pour déduire les facteurs de sélection en utilisant des modèles de réseaux neuronaux profonds et nous constatons que ces modèles de sélection non linéaires décrivent avec précision la distribution des récepteurs immunitaires. Nous étudions les voies de différenciation des cellules T pendant le développement thymique et montrons que les sous-catégories de cellules T ont des structures de répertoire significativement différentes, tant au niveau global que local. Nous montrons que cette même approche peut être adaptée au problème de l’inférence postérieure des paramètres d’un modèle en présence d’une vraisemblance insoluble. Dans ce cadre, le problème devient équivalent à la maximisation de l’information mutuelle entre les paramètres du modèle et les observations sur des données simulées. Nous évaluons des estimateurs alternatifs de l’information mutuelle sur des échantillons de trajectoires de différents processus stochastiques et chaotiques et montrons que ces estimateurs ont des performances similaires. Ce travail démontre qu’une approche “diviser pour mieux régner" de l’inférence statistique peut être un moyen fructueux de décrire les processus biologiques.