Thèse soutenue

Modèles de régression pour données de comptage zéro-inflatées en présence de censure. Applications en économie de la santé

FR  |  
EN
Auteur / Autrice : Van-Trinh Nguyen
Direction : Jean-François Dupuy
Type : Thèse de doctorat
Discipline(s) : Mathématiques et leurs Interactions
Date : Soutenance le 16/03/2020
Etablissement(s) : Rennes, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Institut de recherche mathématique (Rennes ; 1996-....)
Jury : Président / Présidente : Christophe Rault
Examinateurs / Examinatrices : Jean-François Dupuy, Christophe Rault, Sophie Dabo-Niang, Anne-Françoise Yao, Valérie Garès
Rapporteurs / Rapporteuses : Sophie Dabo-Niang, Anne-Françoise Yao

Résumé

FR  |  
EN

L’excès de zéros dans les données de comptage est une situation qui survient dans de nombreux domaines (épidémiologie, économie de la santé. . . ). Les modèles de régression à inflation de zéro fournissent un outil puissant pour analyser ce type de données. Un problème supplémentaire est celui de la censure de la variable réponse. La censure à droite, en particulier, correspond à la situation où l’on observe seulement une borne inférieure sur le comptage considéré. L’analyse statistique de données de comptage en présence d’inflation de zéros et de censure constitue le thème général de ce travail de thèse. Dans une première contribution, nous étudions les propriétés théoriques et numériques de l’estimateur du maximum de vraisemblance dans le modèle de régression de Poisson à inflation de zéros. Nous décrivons également une application de ce modèle sur des données issues du domaine de l’économie de la santé.Le modèle de Poisson à inflation de zéros suppose que toute la surdispersion des données peut être expliquée par un excès de zéros. Lorsqu’une surdispersion supplémentaire est présente, on peut utiliser des modèles alternatifs, tels que les modèles de régression de Poisson généralisé à inflation de zéros (modèle ZIGP) et binomialnégatif à inflation de zéros (modèle ZINB). Dans une deuxième contribution, nous nous intéressons aux propriétés de l’estimateur du maximum de vraisemblance dans les modèles ZIGP et ZINB en présence d’une variable réponse censurée. Nous étudions ces propriétés au moyen de simulations. Puis nous proposons une procédure de sélection simple à mettre en oeuvre. Nous illustrons cette méthodologie sur des données issues du domaine de l’économie de la santé. Dans une troisième contribution, nous nous intéressons à l’inférence statistique dans le modèle de régression de Poisson à inflation de zéros marginal (modèle MZIP), en présence d’une variable réponse censurée. Le modèle MZIP quantifie l’effet des variables explicatives directement sur la moyenne de la loi marginale du comptage (et non sur la moyenne de la loi du comptage pour les individus "susceptibles"). Nous établissons les propriétés asymptotiques de l’estimateur du maximum de vraisemblance dans ce cadre et réalisons une étude de simulations. Enfin, nous illustrons le modèle sur un jeu de données.