Thèse soutenue

Sur les données de comptage dans le cadre des valeurs extrêmes et la modélisation multivariée

FR  |  
EN
Auteur / Autrice : Samuel Valiquette
Direction : Gwladys ToulemondeEric Marchand
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 03/07/2024
Etablissement(s) : Université de Montpellier (2022-....) en cotutelle avec Université de Sherbrooke. Département de mathématiques
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....)
Jury : Président / Présidente : Jean-Noël Bacro
Examinateurs / Examinatrices : Frédéric Mortier, Klaus HERRMANN
Rapporteur / Rapporteuse : Stéphane Girard, Stéphane Robin

Résumé

FR  |  
EN

Cette thèse s’intéresse à certains aspects théoriques de la modélisation des données de comptage. Deux cadres distincts sont abordés : celui des valeurs extrêmes et celui de la modélisation multivariée. Notre première contribution explore, en termes des comportements extrêmes, les liens existants entre le mélange Poisson et sa loi de mélange. Ce travail permet de caractériser et séparer plusieurs familles de lois de mélanges Poisson selon leur comportement en queue. Bien que ce travail soit théorique, nous discutons de son utilité d’un point de vue pratique, notamment pour le choix de la loi de mélange. Notre deuxième contribution porte sur une nouvelle classe de modèles multivariés dénommée Tree Pólya Splitting. Celle-ci repose sur une modélisation hiérarchique et suppose qu’une quantité aléatoire est répartie successivement selon une loi de Pólya à travers une structure d’arbre de partition. Dans ce travail, nous caractérisons les lois marginales univariées et multivariées, les moments factoriels, ainsi que les structures de dépendance (covariance/corrélation) qui en découlent. Nous mettons en évidence, à l’aide d’un jeu de données correspondant à l’abondance de trichoptères, l’intérêt de cette classe de modèles en comparant nos résultats à ceux obtenus, par exemple, avec des modèles de type Poisson log-normale multivariée. Nous concluons cette thèse en présentant diverses perspectives de recherche.