Thèse soutenue

Modélisation stochastique de l'expression des gènes et inférence de réseaux de régulation

FR  |  
EN
Auteur / Autrice : Ulysse Herbach
Direction : Anne-Laure FougèresOlivier GandrillonThibault Espinasse
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 27/09/2018
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale InfoMaths (Lyon ; 2009-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Université Claude Bernard (Lyon ; 1971-....)
Laboratoire : Institut Camille Jordan (Rhône ; 2005-....)
Jury : Président / Présidente : Benoîte de Saporta
Examinateurs / Examinatrices : Olivier Gandrillon, Thibault Espinasse, Nadine Guillotin-Plantard, Eva Löcherbach, Romain Yvinec
Rapporteur / Rapporteuse : Pascale Crépieux, Christian Mazza

Résumé

FR  |  
EN

L'expression des gènes dans une cellule a longtemps été observable uniquement à travers des quantités moyennes mesurées sur des populations. L'arrivée des techniques «single-cell» permet aujourd'hui d'observer des niveaux d'ARN et de protéines dans des cellules individuelles : il s'avère que même dans une population de génome identique, la variabilité entre les cellules est parfois très forte. En particulier, une description moyenne est clairement insuffisante étudier la différenciation cellulaire, c'est-à-dire la façon dont les cellules souches effectuent des choix de spécialisation. Dans cette thèse, on s'intéresse à l'émergence de tels choix à partir de réseaux de régulation sous-jacents entre les gènes, que l'on souhaiterait pouvoir inférer à partir de données. Le point de départ est la construction d'un modèle stochastique de réseaux de gènes capable de reproduire les observations à partir d'arguments physiques. Les gènes sont alors décrits comme un système de particules en interaction qui se trouve être un processus de Markov déterministe par morceaux, et l'on cherche à obtenir un modèle statistique à partir de sa loi invariante. Nous présentons deux approches : la première correspond à une approximation de champ assez populaire en physique, pour laquelle nous obtenons un résultat de concentration, et la deuxième se base sur un cas particulier que l'on sait résoudre explicitement, ce qui aboutit à un champ de Markov caché aux propriétés intéressantes