Statistical analysis of spatio-temporal and multi-dimensional data from a network of sensors - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Statistical analysis of spatio-temporal and multi-dimensional data from a network of sensors

Analyse statistique de données spatio-temporelles et multidimensionnelles issues d’un réseau de capteurs

Yiye Jiang
  • Fonction : Auteur
  • PersonId : 1245764
  • IdRef : 269001158

Résumé

This thesis focuses on the statistical analysis of multivariate time series of different data natures, recorded by a network of sensors. The general goal is to develop the approaches in order to explore and represent the spatial dependency of the multivariate time series. We are firstly interested in identifying such dependency structure and represent it by a graph. In particular, we consider the modelling of the matrix-variate and distributional data, that is a vector or a distribution is observed per time instant per sensor. To this end, we propose two novel auto-regressive (AR) models where the graphs govern the regression dependency, to respectively characterise the matrix-variate and distributional multivariate time series. By fitting the models to the data, the graphs of dependency can then be inferred. For the matrix-variate AR model, we focus on the online inference. We especially incorporate the trend into the data model as the extra parameters, then we propose the online algorithms which can update the graph and trend estimations simultaneously when the new observation arrives. For the distributional multivariate AR model, we rely on the statistics in Wasserstein space to handle the non-Euclidean object data. The proposed regression models help the prediction of further data, meanwhile, the inferred graphs help the data representation and further analysis. Secondly, we study the vector time series that are observed over a network. We are motivated by the fact that, in many applications, the observations over a network exhibit strong cross-node dependency, which makes the data on a subset of nodes highly-predictable by the data on the rest nodes. We are therefore interested in evaluating and ranking the predictability for the nodes in a network. As an application, the derived rankings can be used in the sensor selection as data-driven strategies. From this aspect, the consideration of the neural network as the reconstruction method is innovative.
Cette thèse porte sur l'analyse statistique des séries chronologiques multivariées de différentes natures de données, enregistrées par un réseau de capteurs. L'objectif général est de développer des approches permettant d'explorer et de représenter la dépendance spatiale des séries chronologiques multivariées. Nous nous intéressons tout d'abord à l'identification de telle structure de dépendance et à sa représentation par un graphe. En particulier, nous considérons la modélisation des données matricielles et distribuées, c'est-à-dire à chaque instant du temps un vecteur ou une distribution est observé par un des capteurs dans le réseau. À cette fin, nous proposons deux nouveaux modèles autorégressifs (AR) où les graphes gouvernent la dépendance régressive, pour caractériser respectivement les séries chronologiques matricielles et celles multivariées-distribuées. En fittant les modèles aux données, les graphes de dépendance peuvent ensuite être inférés. Pour le modèle AR matriciel, nous nous concentrons sur online learning. Nous considérons notamment la tendance dans le modèle de données en tant que paramètres supplémentaires, puis nous proposons des algorithmes onlines qui peuvent mettre à jour les estimations du graphe et de la tendance simultanément lors de l'arrivée de nouvelles observations. Pour le modèle AR multivarié-distribué, nous nous appuyons sur les statistiques dans l'espace de Wasserstein pour traiter les objets non-euclidiennes de données. Les modèles de régression proposés aident à la prévision de données futures, en même temps les graphes inférés aident à la représentation des données et à l'analyse ultérieure. Secondement, nous étudions les séries chronologiques vectorielles qui sont observées sur un réseau. Nous sommes motivés par le fait que, dans de nombreuses applications, les observations sur un réseau présentent une forte dépendance entre les noeuds, ce qui rend les données sur un sous-ensemble de noeuds hautement prévisibles par les données sur les autres. Nous sommes donc intéressés par l'évaluation et le classement de la prévisibilité des noeuds d'un réseau. En tant qu'application, les classements dérivés comme stratégies data-drivens servent à la sélection des capteurs. De ce point de vue, la prise en compte du réseau neurone comme méthode de reconstruction est innovante.
Fichier principal
Vignette du fichier
JIANG_YIYE_2022.pdf (28.75 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04062432 , version 1 (07-04-2023)

Identifiants

  • HAL Id : tel-04062432 , version 1

Citer

Yiye Jiang. Statistical analysis of spatio-temporal and multi-dimensional data from a network of sensors. Optimization and Control [math.OC]. Université de Bordeaux, 2022. English. ⟨NNT : 2022BORD0346⟩. ⟨tel-04062432⟩
88 Consultations
13 Téléchargements

Partager

Gmail Facebook X LinkedIn More