Thèse soutenue

Statistiques en grande dimension pour la détection d'anomalies dans les données fonctionnelles issues des satellites

FR  |  
EN
Auteur / Autrice : Clementine Barreyre
Direction : Béatrice LaurentJean-Michel Loubès
Type : Thèse de doctorat
Discipline(s) : Mathematiques appliquees
Date : Soutenance le 18/05/2018
Etablissement(s) : Toulouse, INSA
Ecole(s) doctorale(s) : ECOLE DOCTORALE MATHEMATIQUES, INFORMATIQUE, TELECOMMUNICATIONS DE TOULOUSE
Partenaire(s) de recherche : Laboratoire : IMT - INSTITUT MATHEMATIQUES DE TOULOUSE - UMR 5219- Institut de Mathématiques
Jury : Examinateurs / Examinatrices : Béatrice Laurent, Jean-Michel Loubès, Mathilde Mougeot, Jérôme Saracco, Béatrice Bonneau, Bertrand Cabon, Adeline Leclercq-Samson
Rapporteur / Rapporteuse : Mathilde Mougeot, Jérôme Saracco

Résumé

FR  |  
EN

Ce travail de thèse consiste au développement de méthodes statistiques pour détecter des com- portements anormaux dans les données fonctionnelles que produit le satellite tout au long de sa vie. Un premier travail a été de comprendre comment mettre en évidence les anomalies grâce à des projections sur des bases de fonctions. En complément de cette revue des projections, nous avons appliqué plusieurs méthodes de détection d’anomalies, telles que la One-Class SVM et le Local Outlier Factor (LOF). En plus de ces deux méthodes, nous avons développé notre propre méthode pour prendre en compte la saisonnalité des courbes que nous considérons. En se basant sur cette étude, nous avons développé une nouvelle procédure pour sélectionner automatiquement les coefficients les plus intéressants pour la détection d’anomalies dans un cadre semi-supervisé. Notre méthode est une procédure de tests multiples où nous appliquons un test à deux échantillons à tous les niveaux de coefficients. Nous nous sommes également intéressés aux covariances des télémesures entre elles pour la détection d’anomalies. Pour cela, nous cherchons à comparer les covariances entre un groupe de télémesures pour deux journées, ou périodes consécutives. Nous avons appliqué trois tests sta- tistiques ayant des angles d’approche différents. Nous avons également développé dans ce but un nouveau test asymptotique. Outre la démonstration de la convergence de notre test, nous démontrons par des exemples que ce test est dans la pratique le plus puissant sur les données dont nous disposons. Dans cette thèse, nous avons abordé plusieurs aspects de la détection d’anomalies dans les données fonctionnelles issues des satellites. Pour chacune des méthodes, nous avons pu détecter toutes les anomalies, améliorant sensiblement le taux de fausses alarmes.