Thèse soutenue

Modélisation mathématique de l'expression du gene en espace et en temps

FR  |  
EN
Auteur / Autrice : Maria Knaiir al douaihy
Direction : Ovidiu RadulescuMounia Lagha
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Modélisation
Date : Soutenance le 07/12/2023
Etablissement(s) : Université de Montpellier (2022-....)
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratory of Pathogens and Host Immunity (Montpellier)
Jury : Président / Présidente : Arnaud Debussche
Examinateurs / Examinatrices : Benoîte de Saporta
Rapporteurs / Rapporteuses : Ramon Grima, Michèle Thieullen

Résumé

FR  |  
EN

Avec le development des techniques de visualisation des cellules individuelles, l'hétérogénéité phénotypique émerge, donnant naissance au phénomène connu sous le nom de "bruit" biologique.Ce bruit a été reconnu pour provenir de diverses sources. L’un des facteurs contribuant à cette complexité est le phénomène des "bursts transcriptionnels". Ce comportement dynamique se traduit par des fluctuations des niveaux d’expression des gènes dans un cadre par ailleurs déterministe, principalement lors de la phase d’initiation de la transcription.Dans notre étude, nous nous penchons sur le rôle des éléments régulateurs CIS, tels que les enhancers et les promoteurs. Les promoteurs sont essentiels à la transcription eucaryote, mais pour atteindre un potentiel de transcription maximal, une interaction entre les activateurs et les promoteurs est nécessaire.Pour mieux appréhender la variabilité de l'expression des gènes, nous adoptons une approche mathématique. Nous modélisons la transcription comme une chaîne de Markov, divisée en trois catégories d'états : ON productifs, OFF non productifs et les états de pause. Le promoteur ne démarre la transcription que dans l’état ON ou il déclenche plusieurs départs de RNAP. L'imagerie en direct de la transcription nous permet de suivre ce processus en temps réel.Notre thèse combine des cadres théoriques, des techniques informatiques et des analyses d'imagerie en temps réel de cellules individuelles. Notre objectif principal est de mieux comprendre la nature stochastique de l'expression des gènes, en particulier au niveau transcriptionnel et de résoudre la contradiction apparente entre la stochasticité et la robustesse des mécanismes d'expression des gènes.Nous utilisons le développement embryonnaire de Drosophila melanogaster comme modèle, car son génome est entièrement cartographié, ce qui permet une compréhension complète de ses enhancers et promoteurs, et il offre des techniques d'imagerie en direct fiables.Cependant, les différents critères des données transcriptionnelles qui aboutissent à la traduction nécessitent des approches de modélisation uniques. Nous distinguons deux critères principaux qui nous ont permis de connaître nos limites dans l’extraction d’informations directes à partir des données :1. Signal "homogène dans le temps" vs "inhomogène dans le temps".2. "homogène dans l'espace" vs "inhomogènes dans l'espace".Le terme inhomogène dans le temps (resp. l’espace) vient du fait que le taux de transition entre les différents états discrets du modèle markovien dépend du temps (resp. de l’espace).Par conséquent, nous divisons notre problème en trois conditions principales: homogènes dans le temps et dans l'espace, inhomogènes dans le temps mais homogènes dans l'espace, et inhomogènes dans le temps et dans l'espace.Dans le cadre plus simple de l'homogénéité temporelle et spatiale, nous avons développé un algorithme qui nous aide à identifier 1) Une carte temporelle donnant les moments précis où les différentes molécules d'ARN polymérase initient la production d'ARNm, détaillant les événements de transcription. 2) le nombre d’étapes limitant le taux de transcription, et 3) Identification des paramètres de transition à partir de données d’imagerie en direct.Ensuite, en introduisant des hypothèses plus complexes de temps et d'espace inhomogènes, nous avons développé une méthode de simulation hybride pour modéliser l'expression des gènes avec une extension spatiale. Cela nous a permis d'aborder des aspects critiques de la modélisation de la drosophile : autorégulation négative, mémoire transcriptionnelle.À mesure que la complexité augmente, nous extrayons moins de détails spécifiques des données et commençons à tirer des conclusions plus théoriques. Cette transition reflète le compromis entre la richesse des données expérimentales et la profondeur de la compréhension théorique dans notre exploration des complexités de la modélisation de l'expression génique.