Thèse soutenue

Modèles de mutation : étude probabiliste et estimation paramétrique

FR  |  
EN
Auteur / Autrice : Adrien Mazoyer
Direction : Bernard Ycart
Type : Thèse de doctorat
Discipline(s) : Mathématiques Appliquées
Date : Soutenance le 04/07/2017
Etablissement(s) : Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble)
Jury : Président / Présidente : Adeline Leclercq-Samson
Examinateurs / Examinatrices : Agnès Hamon, Guillaume Martin
Rapporteur / Rapporteuse : Sylvie Méléard, Philip J. Gerrish

Résumé

FR  |  
EN

Les modèles de mutations décrivent le processus d’apparitions rares et aléatoires de mutations au cours de lacroissance d’une population de cellules. Les échantillons obtenus sont constitués de nombres finaux de cellules mutantes,qui peuvent être couplés avec des nombres totaux de cellules ou un nombre moyen de cellules en fin d’expérience.La loi du nombre final de mutantes est une loi à queue lourde : de grands décomptes, appelés “jackpots”,apparaissent fréquemment dans les données.Une construction générale des modèles se décompose en troisniveaux. Le premier niveau est l’apparition de mutations aléatoires au cours d’un processus de croissance de population.En pratique, les divisions cellulaires sont très nombreuses, et la probabilité qu’une de ces divisions conduise à une mutation est faible,ce qui justifie une approximation poissonnienne pour le nombre de mutations survenant pendant un temps d’observation donné.Le second niveau est celui des durées de développement des clones issus de cellules mutantes. Du fait de la croissance exponentielle,la majeure partie des mutations ont lieu à la fin du processus, et les durées de développement sont alors indépendanteset exponentiellement distribuées. Le troisième niveau concerne le nombre decellules qu’un clone issu d’une cellule mutante atteint pendant une durée de développement donnée.La loi de ce nombre dépend principalement de la loi des instants de division des mutantes.Le modèle classique, dit de Luria-Delbrück, suppose que les développements cellulaires des cellules normales aussi bien que mutantess’effectue selon un processus de Yule. On peut dans ce cas calculer expliciter la loi du nombre final de mutantes.Elle dépend de deux paramètres, qui sont le nombre moyen de mutations et le paramètre de fitness (ratio des taux de croissance des deux types de cellules).Le problème statistique consiste à estimer ces deux paramètres au vu d’un échantillon denombres finaux de mutantes. Il peut être résolu par maximisation de la vraisemblance,ou bien par une méthode basée sur la fonction génératrice. Diviser l'estimation du nombre moyen de mutations par le nombre total de cellulespermet alors d'estimer la probabilité d’apparition d’une mutation au cours d’une division cellulaire.L’estimation de cette probabilité est d’une importancecruciale dans plusieurs domaines de la médecine et debiologie: rechute de cancer, résistance aux antibiotiques de Mycobacterium Tuberculosis, etc.La difficulté provient de ce que les hypothèses de modélisation sous lesquelles la distribution du nombre final de mutants est explicitesont irréalistes.Or estimer les paramètres d’un modèle quand la réalité en suit un autre conduit nécessairement à un biais d’estimation.Il est donc nécessaire de disposer de méthodes d’estimation robustes pour lesquelles le biais, en particulier sur la probabilité de mutation,reste le moins sensible possible aux hypothèses de modélisation.Cette thèse contient une étude probabiliste et statistique de modèles de mutations prenant en compte les sources de biais suivantes : durées de vie non exponentielles, morts cellulaires,variabilité du nombre final de cellules, durées de vie non-exponentielles et non-identiquement distribuées, dilution de la population initiale.Des études par simulation des méthodes considérées sont effectuées afin de proposer, selon les caractéristiques du modèle,l’estimation la plus fiable possible. Ces méthodes ont également été appliquées à desjeux de données réelles, afin de comparer les résultats avec les estimations obtenues avec les modèles classiques.Un package R a été implémenté en collaboration avec Rémy Drouilhet et Stéphane Despréaux et est disponible sur le CRAN.Ce package est constitué des différents résultats obtenus au cours de ce travail. Il contient des fonctions dédiées aux modèles de mutations,ainsi qu'à l'estimation des paramètres. Les applications ont été développées pour le Labex TOUCAN (Toulouse Cancer).