Thèse soutenue

Analyse statistique de données spatio-temporelles et multidimensionnelles issues d’un réseau de capteurs
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Yiye Jiang
Direction : Jérémie BigotSofian Maabout
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées et calcul scientifique
Date : Soutenance le 07/12/2022
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : École doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Institut de mathématiques de Bordeaux
Jury : Président / Présidente : Bernard Bercu
Examinateurs / Examinatrices : Fadila Bentayeb, Nicolas Tremblay
Rapporteurs / Rapporteuses : Sophie Achard, Alexander Petersen

Résumé

FR  |  
EN

Cette thèse porte sur l'analyse statistique des séries chronologiques multivariées de différentes natures de données, enregistrées par un réseau de capteurs. L'objectif général est de développer des approches permettant d'explorer et de représenter la dépendance spatiale des séries chronologiques multivariées. Nous nous intéressons tout d'abord à l'identification de telle structure de dépendance et à sa représentation par un graphe. En particulier, nous considérons la modélisation des données matricielles et distribuées, c'est-à-dire à chaque instant du temps un vecteur ou une distribution est observé par un des capteurs dans le réseau. À cette fin, nous proposons deux nouveaux modèles autorégressifs (AR) où les graphes gouvernent la dépendance régressive, pour caractériser respectivement les séries chronologiques matricielles et celles multivariées-distribuées. En fittant les modèles aux données, les graphes de dépendance peuvent ensuite être inférés. Pour le modèle AR matriciel, nous nous concentrons sur online learning. Nous considérons notamment la tendance dans le modèle de données en tant que paramètres supplémentaires, puis nous proposons des algorithmes onlines qui peuvent mettre à jour les estimations du graphe et de la tendance simultanément lors de l'arrivée de nouvelles observations. Pour le modèle AR multivarié-distribué, nous nous appuyons sur les statistiques dans l'espace de Wasserstein pour traiter les objets non-euclidiennes de données. Les modèles de régression proposés aident à la prévision de données futures, en même temps les graphes inférés aident à la représentation des données et à l'analyse ultérieure. Secondement, nous étudions les séries chronologiques vectorielles qui sont observées sur un réseau. Nous sommes motivés par le fait que, dans de nombreuses applications, les observations sur un réseau présentent une forte dépendance entre les noeuds, ce qui rend les données sur un sous-ensemble de noeuds hautement prévisibles par les données sur les autres. Nous sommes donc intéressés par l'évaluation et le classement de la prévisibilité des noeuds d'un réseau. En tant qu'application, les classements dérivés comme stratégies data-drivens servent à la sélection des capteurs. De ce point de vue, la prise en compte du réseau neurone comme méthode de reconstruction est innovante.