Modèles de régression pour données de comptage zéro-inflatées en présence de censure. Applications en économie de la santé
Auteur / Autrice : | Van-Trinh Nguyen |
Direction : | Jean-François Dupuy |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et leurs Interactions |
Date : | Soutenance le 16/03/2020 |
Etablissement(s) : | Rennes, INSA |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Institut de recherche mathématique (Rennes ; 1996-....) |
Jury : | Président / Présidente : Christophe Rault |
Examinateurs / Examinatrices : Jean-François Dupuy, Christophe Rault, Sophie Dabo-Niang, Anne-Françoise Yao, Valérie Garès | |
Rapporteurs / Rapporteuses : Sophie Dabo-Niang, Anne-Françoise Yao |
Mots clés
Résumé
L’excès de zéros dans les données de comptage est une situation qui survient dans de nombreux domaines (épidémiologie, économie de la santé. . . ). Les modèles de régression à inflation de zéro fournissent un outil puissant pour analyser ce type de données. Un problème supplémentaire est celui de la censure de la variable réponse. La censure à droite, en particulier, correspond à la situation où l’on observe seulement une borne inférieure sur le comptage considéré. L’analyse statistique de données de comptage en présence d’inflation de zéros et de censure constitue le thème général de ce travail de thèse. Dans une première contribution, nous étudions les propriétés théoriques et numériques de l’estimateur du maximum de vraisemblance dans le modèle de régression de Poisson à inflation de zéros. Nous décrivons également une application de ce modèle sur des données issues du domaine de l’économie de la santé.Le modèle de Poisson à inflation de zéros suppose que toute la surdispersion des données peut être expliquée par un excès de zéros. Lorsqu’une surdispersion supplémentaire est présente, on peut utiliser des modèles alternatifs, tels que les modèles de régression de Poisson généralisé à inflation de zéros (modèle ZIGP) et binomialnégatif à inflation de zéros (modèle ZINB). Dans une deuxième contribution, nous nous intéressons aux propriétés de l’estimateur du maximum de vraisemblance dans les modèles ZIGP et ZINB en présence d’une variable réponse censurée. Nous étudions ces propriétés au moyen de simulations. Puis nous proposons une procédure de sélection simple à mettre en oeuvre. Nous illustrons cette méthodologie sur des données issues du domaine de l’économie de la santé. Dans une troisième contribution, nous nous intéressons à l’inférence statistique dans le modèle de régression de Poisson à inflation de zéros marginal (modèle MZIP), en présence d’une variable réponse censurée. Le modèle MZIP quantifie l’effet des variables explicatives directement sur la moyenne de la loi marginale du comptage (et non sur la moyenne de la loi du comptage pour les individus "susceptibles"). Nous établissons les propriétés asymptotiques de l’estimateur du maximum de vraisemblance dans ce cadre et réalisons une étude de simulations. Enfin, nous illustrons le modèle sur un jeu de données.