Estimation parcimonieuse et apprentissage de dictionnaires pour la détection d'anomalies multivariées dans des données mixtes de télémesure satellites

par Barbara Pilastre

Thèse de doctorat en Mathématiques Appliquées

Sous la direction de Jean-Yves Tourneret.

Le président du jury était Gersende Fort.

Le jury était composé de Jean-Yves Tourneret, Jérôme Mars, Paulo Gonçalvès, Guillaume Ginolhac, Stéphane d' Escrivan, Loïc Boussouf.

Les rapporteurs étaient Jérôme Mars, Paulo Gonçalvès.


  • Résumé

    La surveillance automatique de systèmes et la prévention des pannes sont des enjeux majeurs dans de nombreux secteurs et l'industrie spatiale ne fait pas exception. Par exemple, le succès des missions des satellites suppose un suivi constant de leur état de santé réalisé à travers la surveillance de la télémesure. Les signaux de télémesure sont des données issues de capteurs embarqués qui sont reçues sous forme de séries temporelles décrivant l'évolution dans le temps de différents paramètres. Chaque paramètre est associé \`a une grandeur physique telle qu'une température, une tension ou une pression, ou à un équipement dont il reporte le fonctionnement à chaque instant. Alors que les approches classiques de surveillance atteignent leurs limites, les méthodes d'apprentissage automatique (machine learning en anglais) s'imposent afin d'améliorer la surveillance de la télémesure via un apprentissage semi-supervisé: les signaux de télémesure associés à un fonctionnement normal du système sont appris pour construire un modèle de référence auquel sont comparés les signaux de télémesure récemment acquis. Les méthodes récentes proposées dans la littérature ont permis d'améliorer de manière significative le suivi de l'état de santé des satellites mais elles s'intéressent presque exclusivement à la détection d'anomalies univariées pour des paramètres physiques traités indépendamment. L'objectif de cette thèse est de proposer des algorithmes pour la détection d'anomalies multivariées capables de traiter conjointement plusieurs paramètres de télémesure associés à des données de différentes natures (continues/discrètes), et de prendre en compte les corrélations et les relations qui peuvent exister entre eux. L'idée motrice de cette thèse est de supposer que la télémesure fraîchement reçue peut être estimée à partir de peu de données décrivant un fonctionnement normal du satellite. Cette hypothèse justifie l'utilisation de méthodes d'estimation parcimonieuse et d'apprentissage de dictionnaires qui seront étudiées tout au long de cette thèse. Une deuxième forme de parcimonie propre aux anomalies satellites a également motivé ce choix, à savoir la rareté des anomalies satellites qui affectent peu de paramètres en même temps. Dans un premier temps, un algorithme de détection d'anomalies multivariées basé sur un modèle d'estimation parcimonieuse est proposé. Une extension pondérée du modèle permettant d'intégrer de l'information externe est également présentée ainsi qu'une méthode d'estimation d'hyperparamètres qui a été developpée pour faciliter la mise en œuvre de l'algorithme. Dans un deuxième temps, un modèle d'estimation parcimonieuse avec un dictionnaire convolutif est proposé. L'objectif de cette deuxième méthode est de contourner le problème de non-invariance par translation dont souffre le premier algorithme. Les différentes méthodes proposées sont évaluées sur plusieurs cas d'usage industriels associés à de réelles données satellites et sont comparées aux approches de l'état de l'art.

  • Titre traduit

    Anomaly Detection in Mixed Telemetry Data using Sparse Representation and Dictionary Learning


  • Résumé

    Spacecraft health monitoring and failure prevention are major issues in many fields and space industry has not escaped to this trend. Indeed, the proper conduct of satellite missions involves ensuring satellites good health and detect failures as soon as possible. This important task is performed by analyzing housekeeping telemetry data using anomaly detection methods. Housekeeping telemetry consist of sensors data recorded on board and received as time series describing the time evolution of various parameters. Each parameter is associated with physical quantity such as a temperature, a voltage or a pressure, or an equipement status. As conventional monitoring methods reach their limits, statistical machine learning methods have been studied to improve satellite telemetry monitoring via a semi-supervised learning: telemetry associated with normal operations of the spacecraft is learned to build a reference model. Then, more recent data is compared to this model in order to detect any potential anomalies. Most of the methods recently proposed focus on univariate anomaly detection for continuous parameters and handle telemetry parameters independently remove. The purpose of this thesis is to propose algorithms for multivariate anomaly detection which can handle mixed telemetry parameters jointly and take into account the correlations and relationships that may exist between them in order to detect univariate and multivariate anomalies. In this work we assume that telemetry signals can be approximated using few telemetry signals associated with normal satellite operations. This first hypothesis of sparsity justifies the use of sparse representation methods that will be studied throughout this thesis. This choice is also motivated by a second form of sparsity which is specific to satellite anomalies and reflect the fact that anomalies are rare and affect few parameters at the same time. In a first time, a multivariate anomaly detection algorithm based on a sparse estimation model is proposed. A weighted extension of the method which integrates external information is presented as well as a hyperparameter estimation method that has been developed to facilitate the operationnal use of the algorithm. In a second step, a sparse estimation model with a convolutional dictionary is proposed. The objective of this second method is to exploit the shiftinvariance property of convolutional dictionnaries and improve the detection. The proposed methods are finally evaluated on industrial use cases associated with real telemetry data and are compared to state-of-the-art approches.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Institut national polytechnique. Service commun de la documentation.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.