Thèse en cours

Inférence statistique des trajectoires évolutives

FR  |  
EN

Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu le 08/07/2022. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Natanael Spisak
Direction : Aleksandra WalczakThierry Mora
Type : Projet de thèse
Discipline(s) : Physique
Date : Inscription en doctorat le
Soutenance le 08/07/2022
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Physique en Île-de-France (Paris ; 2014-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de physique de l'ENS (Paris ; 2019-....)
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)
Jury : Président / Présidente : Hélène Morlon
Examinateurs / Examinatrices : Aleksandra Walczak, Frederick Matsen, Gur Yaari, Thierry Mora, Juliana Silva bernardes
Rapporteurs / Rapporteuses : Frederick Matsen, Gur Yaari

Résumé

FR  |  
EN

Le système immunitaire est un système complexe multi-échelles englobant de nombreux mécanismes qui assurent la protection contre les menaces pathogènes. Dans cette thèse, nous nous concentrons sur un sous-ensemble particulier du système immunitaire, le répertoire des lymphocytes B. Afin de s'adapter aux antigènes, les cellules B sont équipées de mécanismes de diversification somatique qui génèrent une grande diversité de récepteurs et permettent de les modifier lors d'un stimulus antigénique. La principale source de diversité est le processus de recombinaison V(D)J, dans lequel les gènes codant pour les récepteurs sont formés à partir de modèles encodés dans le génome. Une seconde modification des récepteurs a lieu au cours du processus de maturation de l'affinité, un processus darwinien dans lequel la diversité générée de manière stochastique est utilisée pour s'adapter aux changements environnementaux, dans ce contexte dû aux infections. Le travail présenté dans cette thèse est centré sur le développement de méthodes statistiques pour décrire le répertoire des cellules B en utilisant des ensembles de données de séquençage à haut débit. Nous montrons que la diversité du répertoire des cellules B permet d'identifier des lignées de cellules issues du même événement de recombinaison V(D)J et diversifiées lors de la maturation de l'affinité. Nous proposons une nouvelle méthode qui exploite les modèles probabilistes de recombinaison et incorpore le signal phylogénétique pour reconstruire les lignées avec une grande précision. L'identification des lignées est le fondement d'une approche phylogénétique qui nous permet de modéliser le processus de mutation et de quantifier la dépendance du taux de mutation à la position et au contexte de la séquence. Dans la deuxième partie de cette thèse, nous étudions le problème de l'inférence bayésienne dans le cas où la vraisemblance est compliquée à estimer. Nous introduisons un nouveau cadre pour l'inférence basée sur la simulation qui propose une interprétation en terme d'information mutuelle. Nous étudions la performance d'estimateurs alternatifs de l'information mutuelle pour estimer la fonction de probabilité a posteriori de trajectoires de processus stochastiques.