Structure learning to unravel mechanisms of the immune system

par Helena Todorov

Thèse de doctorat en Bioinformatique

Sous la direction de Jacqueline Marvel et de Yvan Saeys.

Le président du jury était Steven Maere.

Le jury était composé de Jacqueline Marvel, Yvan Saeys, Steven Maere, Martin Guilliams, Claire Lesieur, Kavé Salamatian, Joke Reumers.

Les rapporteurs étaient Martin Guilliams, Claire Lesieur, Kavé Salamatian.

  • Titre traduit

    Apprentissage de structure pour démêler les mécanismes du système immunitaire


  • Résumé

    Les cellules de notre système immunitaire jouent un rôle essentiel en nous protégeant de pathogènes infectieux tels que les virus ou certaines bactéries. Lors d’une maladie, les différents types de cellules immunitaires jouent des rôles spécifiques et interagissent, générant ainsi une réponse immunitaire adéquate. Cependant, cette réponse immunitaire complexe peut parfois être perturbée. Par exemple, les cellules qui sont supposées combattre l’infection peuvent être rendues silencieuses. Ce phénomène est observé dans certaines tumeurs, dans lesquelles des cellules peuvent commencer à proliférer de façon anormale sans être contrôlées par une réponse immune fonctionnelle. Comprendre comment le système immunitaire fonctionne lors d’une maladie est donc d’une importance cruciale pour trouver des thérapies efficaces. Les cellules du système immunitaire peuvent maintenant être étudiées grâce à des technologies qui génèrent de grandes quantités d’information concernant la forme, le type, ou les molécules contenues dans ces cellules. Cette immense quantité d’information représente un réel challenge pour les médecins qui se doivent de l’analyser. Ce contexte a mené au développement de beaucoup d’outils informatiques, qui permettent d’automatiser l’analyse de données médicales. Ces outils computationnels remplissent différentes fonctions, telles que le prétraitement (permettant d’obtenir des données propres, dans lesquelles le bruit technique est diminué), la sélection de variables (permettant d’identifier des variables d’intérêt), le clustering (permettant d’identifier des groupes de cellules similaires), l’inférence de trajectoire (permettant d’identifier des processus de développement), et l’inférence de réseaux d’interactions de gènes (permettant d’identifier les interactions entre certains gènes et leurs cibles), entre autres. Ce travail résulte de l’application et de la création de solutions computationnelles pour l’analyse de données single-cell. Dans la première partie de cette thèse, nous nous sommes essentiellement concentrés sur l’identification de structures dans les données. Nous présentons dans un premier temps TinGa, un outil capable d’identifier des trajectoires de développement de manière rapide et flexible. L’inférence de trajectoire repose en général sur la compression de l’information comprise au sein de milliers de gènes en un espace de faibles dimensions. Nous présentons donc, dans un second temps, une approche exploratoire que nous avons mis en place afin de calculer un espace de faibles dimensions optimal, dans lequel l’identification de trajectoires serait facilitée. Troisièmement, nous avons appliqué l’inférence de trajectoire ainsi que BRED, une nouvelle méthode d’inférence de réseaux de régulation de gènes, dans le but de mieux comprendre la réponse de cellules T CD8 à une infection virale aigüe. Nous avons identifié deux sources de cellules mémoires le long de la trajectoire suivie par les cellules T CD8, et nous les avons caractérisés. Finale- ment, nous présentons les résultats d’une étude multi-omique qui avait pour but d’identifier les différences qui existent entre des patients qui tolèrent la greffe de moelle osseuse, et d’autres patients, qui développent la maladie du greffon contre l’hôte. En intégrant trois différents types de données, nous avons pu identifier l’importance cruciale d’un équilibre entre un état d’activation et de repos du système immunitaire chez ces patients. Les outils computationnels permettent l’analyse de nouveaux types de données à large échelle, de manière rapide et efficace. En permettant d’automatiser des analyses qui étaient jusqu’à présent faites manuellement, ces outils présentent de multiples avantages. [...]


  • Résumé

    The cells of our immune system play an essential role in protecting us from infections from pathogens such as viruses or harmful bacteria. In the context of a disease, the different types of immune cells perform special roles and interact, resulting in a finely orchestrated immune response. However, this complex immune response can in some cases be disrupted. For instance, the cells that are supposed to fight a disease can be silenced. This phenomenon can be observed in tumors, in which cells can start proliferating abnormally without being controlled by a functional immune response. Understanding how the immune system works in the context of a disease is therefore of crucial importance if we want to find efficient therapies. The cells from the immune system can now be thoroughly studied with technologies that generate unprecedented amounts of in- formation on these cells’ shape, type, and on the molecules that they contain. This enormous amount of data represents a challenge for the doctors who need to analyse it. In this context, many computational tools are being developed, to automate the analysis of medical data. These computational tools tackle typical data analysis issues, such as preprocessing (to obtain clean, noise-free data), feature selection (to identify cell features of interest), clustering (to identify groups of similar cells), trajectory inference (to identify developmental processes), and network inference (to identify genes that can influence other genes), among others. The topic of this thesis is the application and design of computational solutions for single-cell data analysis. In the first part of this the- sis, we essentially focus on identifying structure in this type of data. We first present a new computational tool for trajectory inference, TinGa, that can identify cell developmental trajectories in a fast and flexible way. Trajectories are typically identified by compressing the information contained in thousands of genes into a low-dimensional space. We thus secondly present an exploratory study, in which we aimed at computing an optimal low-dimensional space in which the identification of a trajectory would be facilitated. Thirdly, we applied trajectory inference as well as a new network inference method, BRED, to gain biological insight on the response of CD8 T cells upon an acute viral infection. We identified two sources of memory along the developmental trajectory followed by activated CD8 T cells, and we characterised these two memory precursor populations. Finally, we report our results on a multi-omics study that aimed at unraveling differences between patients that were tolerant to a graft trans- plantation and patients who developed graft-versus-host disease. By integrating three different types of data, we were able to uncover the crucial role between an activated state and a steady state of the immune system in these patients. Computational tools allow to analyse new types of large scale datasets in a fast and efficient way. By allowing to automate analyses that were previously performed manually, they present multiple advantages. First, they make it possible to analyse data of unprecedented size and complexity. Secondly, they significantly reduce the time typically needed for the analysis of any type of data. Lastly, they lead to more robust results, since correctly set computational experiments can be repeated by different persons and will lead to identical results. Altogether, the development and application of computational tools can lead to more robust and reproducible single-cell omics research.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque Diderot . Bibliothèque électronique (Lyon).
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.