Sur les données de comptage dans le cadre des valeurs extrêmes et la modélisation multivariée
Auteur / Autrice : | Samuel Valiquette |
Direction : | Gwladys Toulemonde, Eric Marchand |
Type : | Thèse de doctorat |
Discipline(s) : | Biostatistique |
Date : | Soutenance le 03/07/2024 |
Etablissement(s) : | Université de Montpellier (2022-....) en cotutelle avec Université de Sherbrooke. Département de mathématiques |
Ecole(s) doctorale(s) : | École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....) |
Jury : | Président / Présidente : Jean-Noël Bacro |
Examinateurs / Examinatrices : Frédéric Mortier, Klaus HERRMANN | |
Rapporteur / Rapporteuse : Stéphane Girard, Stéphane Robin |
Mots clés
Résumé
Cette thèse s’intéresse à certains aspects théoriques de la modélisation des données de comptage. Deux cadres distincts sont abordés : celui des valeurs extrêmes et celui de la modélisation multivariée. Notre première contribution explore, en termes des comportements extrêmes, les liens existants entre le mélange Poisson et sa loi de mélange. Ce travail permet de caractériser et séparer plusieurs familles de lois de mélanges Poisson selon leur comportement en queue. Bien que ce travail soit théorique, nous discutons de son utilité d’un point de vue pratique, notamment pour le choix de la loi de mélange. Notre deuxième contribution porte sur une nouvelle classe de modèles multivariés dénommée Tree Pólya Splitting. Celle-ci repose sur une modélisation hiérarchique et suppose qu’une quantité aléatoire est répartie successivement selon une loi de Pólya à travers une structure d’arbre de partition. Dans ce travail, nous caractérisons les lois marginales univariées et multivariées, les moments factoriels, ainsi que les structures de dépendance (covariance/corrélation) qui en découlent. Nous mettons en évidence, à l’aide d’un jeu de données correspondant à l’abondance de trichoptères, l’intérêt de cette classe de modèles en comparant nos résultats à ceux obtenus, par exemple, avec des modèles de type Poisson log-normale multivariée. Nous concluons cette thèse en présentant diverses perspectives de recherche.