Modélisation probabiliste en biologie cellulaire et moléculaire

par Romain Yvinec

Thèse de doctorat en Mathématiques

Soutenue le 05-10-2012

à Lyon 1 , dans le cadre de École doctorale en Informatique et Mathématiques de Lyon , en partenariat avec Institut Camille Jordan (laboratoire) .


  • Résumé

    De nombreux travaux récents ont démontré l’importance de la stochasticité dans l’expression des gènes à différentes échelles. On passera tout d’abord en revue les principaux résultats expérimentaux pour motiver l’étude de modèles mathèmatiques prenant en comptedes effets aléatoires. On étudiera ensuite deux modèles particuliers où les effets aléatoires induisent des comportements intéressants, en lien avec des résultats expérimentaux : une dynamique intermittente dans un modèle d’auto-régulation de l’expression d’un gène ; et l’émergence d’hétérogénéité à partir d’une population homogène de protéines par modification post-traductionnelle. Dans le Chapitre I, nous avons étudié le modèle standard d’expression des gènes à trois variables : ADN, ARN messager et protéine. L’ADN peut être dans deux états, respectivement “ON“ et “OFF“. La transcription (production d’ARN messagers) peut avoir lieu uniquement dans l’état “ON“. La traduction (production de protéines) est proportionnelleà la quantité d’ARN messager. Enfin la quantité de protéines peut réguler de manière non-linéaire les taux de production précédent. Nous avons utilisé des théorèmesde convergence de processus stochastique pour mettre en évidence différents régimes de ce modèle. Nous avons ainsi prouvé rigoureusement le phénomène de production intermittente d’ARN messagers et/ou de protéines. Les modèles limites obtenues sont alors des modèles hybrides, déterministes par morceaux avec sauts Markoviens. Nous avons étudié le comportement en temps long de ces modèles et prouvé la convergence vers des solutions stationnaires. Enfin, nous avons étudié en détail un modèle réduit, calculé explicitement la solution stationnaire, et étudié le diagramme de bifurcation des densités stationnaires. Ceci a permis 1) de mettre en évidence l’influence de la stochasticité en comparant aux modèles déterministes ; 2) de donner en retour un moyen théorique d’estimer la fonctionde régulation par un problème inverse. Dans le Chapitre II, nous avons étudié une version probabiliste du modèle d’agrégation fragmentation. Cette version permet une définition de la nucléation en accord avec les modèles biologistes pour les maladies à Prion. Pour étudier la nucléation, nous avons utilisé une version stochastique du modèle de Becker-Dôring. Dans ce modèle, l’agrégation est réversible et se fait uniquement par attachement/détachement d’un monomère. Le temps de nucléation est définit comme le premier temps où un noyau (c’est-à-dire un agrégat de taille fixé, cette taille est un paramètre du mod`ele) est formé. Nous avons alors caractérisé la loi du temps de nucléation dans ce modèle. La distribution de probabilitédu temps de nucléation peut prendre différente forme selon les valeurs de paramètres : exponentielle, bimodale, ou de type Weibull. Concernant le temps moyen de nucléation, nous avons mis en évidence deux phénomènes importants. D’une part, le temps moyen denucl´eation est une fonction non-monotone du paramètre cinétique d’agrégation. D’autre part, selon la valeur des autres paramètres, le temps moyen de nucléation peut dépendre fortement ou très faiblement de la quantité initiale de monomère . Ces caractérisations sont importantes pour 1) expliquer des dépendances très faible en les conditions initiales,observées expérimentalement ; 2) déduire la valeur de certains paramètres d’observations expérimentales. Cette étude peut donc être appliqué à des données biologiques. Enfin, concernant un modèle de polymérisation-fragmentation, nous avons montré un théorème limite d’un modèle purement discret vers un modèle hybride, qui peut-être plus utile pourdes simulations numériques, ainsi que pour une étude théorique.

  • Titre traduit

    Probabilistic modeling in cellular and molecular biology


  • Résumé

    The importance of stochasticity in gene expression has been widely shown recently. Wewill first review the most important related work to motivate mathematical models thattakes into account stochastic effects. Then, we will study two particular models where stochasticityinduce interesting behavior, in accordance with experimental results : a bursting dynamic in a self-regulating gene expression model ; and the emergence of heterogeneityfrom a homogeneous pool of protein by post-translational modification.In Chapter I, we studied a standard gene expression model, at three variables : DNA, messenger RNA and protein. DNA can be in two distinct states, ”ON“ and ”OFF“. Transcription(production of mRNA) can occur uniquely in the ”ON“ state. Translation (productionof protein) is proportional to the quantity of mRNA. Then, the quantity of proteincan regulate in a non-linear fashion these production rates. We used convergence theoremof stochastic processes to highlight different behavior of this model. Hence, we rigorously proved the bursting phenomena of mRNA and/or protein. Limiting models are then hybridmodel, piecewise deterministic with Markovian jumps. We studied the long time behaviorof these models and proved convergence toward a stationary state. Finally, we studied indetail a reduced model, explicitly calculated the stationary distribution and studied itsbifurcation diagram. Our two main results are 1) to highlight stochastic effects by comparisonwith deterministic model ; 2) To give back a theoretical tool to estimate non-linear regulation function through an inverse problem. In Chapter II, we studied a probabilistic version of an aggregation-fragmentation model. This version allows a definition of nucleation in agreement with biological model for Prion disease. To study the nucleation, we used a stochastic version of the Becker-Döring model. In this model, aggregation is reversible and through attachment/detachment of amonomer. The nucleation time is defined as a waiting time for a nuclei (aggregate of afixed size, this size being a parameter of the model) to be formed. In this work, we characterized the law of the nucleation time. The probability distribution of the nucleation timecan take various forms according parameter values : exponential, bimodal or Weibull. Wealso highlight two important phenomena for the mean nucleation time. Firstly, the mean nucleation time is a non-monotone function of the aggregation kinetic parameter. Secondly, depending of parameter values, the mean nucleation time can be strongly or very weakly correlated with the initial quantity of monomer. These characterizations are important for 1) explaining weak dependence in initial condition observed experimentally ; 2) deducingsome parameter values from experimental observations. Hence, this study can be directly applied to biological data. Finally, concerning a polymerization-fragmentation model, weproved a convergence theorem of a purely discrete model to hybrid model, which may beuseful for numerical simulations as well as a theoretical study.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Claude Bernard. Service commun de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.