Thèse soutenue

Tests de comparaison de deux populations et statistiques de balayage spatial pour données fonctionnelles

FR  |  
EN
Auteur / Autrice : Zaineb Smida
Direction : Ali GannounLionel Cucala
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 30/11/2021
Etablissement(s) : Montpellier
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....)
Jury : Président / Présidente : Jean-Noël Bacro
Examinateurs / Examinatrices : Anne Ruiz-Gazen, Jérôme Saracco
Rapporteurs / Rapporteuses : Liliane Bel, Cristian Preda

Résumé

FR  |  
EN

Dans cette thèse, nous nous focalisons d'un côté sur les tests statistiques de comparaison de deux échantillons basés sur les rangs et d'un autre côté sur la méthode de détection d'agrégats basée sur les statistiques de balayage spatial. Dans les deux cas, le travail a été effectué en utilisant des données fonctionnelles. L'objectif est d'étendre les méthodes développées dans le cadre univarié c'est-à-dire à destination des variables aléatoires à valeurs dans R au cadre fonctionnel c'est-à-dire en utilisant des variables aléatoires à valeurs dans un espace fonctionnel. Dans la première partie, nous étudions le test de la médiane basé sur les rangs dans le cadre univarié. Nous proposons ensuite une extension de ce dernier pour des données fonctionnelles. Puis, nous étudions le comportement asymptotique de sa statistique sous l'hypothèse nulle. Cette extension est comparée à d’autres statistiques paramétriques et non paramétriques existantes en utilisant des données simulées et des données réelles pour étudier sa puissance. Dans la deuxième partie, nous introduisons une statistique de balayage spatial non paramétrique pour des données fonctionnelles. Cette statistique est dérivée de celle de Wilcoxon-Mann-Whitney définie dans un espace de Hilbert. La méthode de balayage proposée est appliquée sur des données simulées pour évaluer sa performance, ensuite sur des données réelles pour extraire des caractéristiques de l’évolution démographique de la population espagnole. Dans la dernière partie, nous développons un package R intitulé HDSpatialScan. Il permet d'appliquer les statistiques de balayage spatial récemment développées pour des données fonctionnelles, y compris la statistique de balayage introduite dans cette thèse. Ce package facilite l'utilisation des méthodes de balayage et permet de visualiser les agrégats détectés d'une manière simple et rapide.