Thèse soutenue

Détection d’anomalies multiples par apprentissage automatique de règles dans les séries temporelles

FR  |  
EN
Auteur / Autrice : Inès Ben Kraiem
Direction : Olivier TesteAndré Péninou
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 29/01/2021
Etablissement(s) : Toulouse 2
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)
Jury : Président / Présidente : Florence Sèdes
Examinateurs / Examinatrices : Olivier Teste, André Péninou, Anne Laurent, Pierre Gançarski, Claudia Lucia Roncancio, Karine Bennis-Zeitouni, Faïza Jedidi
Rapporteur / Rapporteuse : Anne Laurent, Pierre Gançarski

Résumé

FR  |  
EN

Dans cette thèse, nous avons focalisé sur l'utilisation de techniques d’apprentissage automatique dans le but d'automatiser et de consolider le processus de détection des anomalies dans les données de réseaux de capteurs. Ces données proviennent de capteurs se présentent sous forme de séries temporelles. Pour ce faire, nous avons défini deux objectifs principaux: la détection d'anomalies multiples et la génération de règles interprétables par l’être humain pour la détection d'anomalies. Le premier objectif consiste à détecter différents types d’anomalies dans les données de capteurs. Dans les travaux de recherche existants, il existe un travail approfondi sur la détection d'anomalies. Cependant, la plupart des techniques recherchent des objets individuels qui sont différents des objets normaux ou bien des séquences de données, mais ne prennent pas en compte la détection de multiples anomalies. Pour résoudre cette problématique et atteindre notre premier enjeu, nous avons créé un système configurable de détection d'anomalies multiples qui est basé sur des motifs pour détecter les anomalies dans les séries temporelles. L’algorithme que nous proposons, Composition of Remarquable Point (CoRP), est basé sur le principe de recherche de motifs. Cet algorithme applique un ensemble de motifs afin d’annoter les points remarquables dans une série temporelle uni-variée, puis détecte les anomalies par composition de motifs. Les motifs d’annotation et les compositions de motifs sont définis avec l’aide de l’expert du domaine. Notre méthode a l'avantage de localiser et de catégoriser les différents types d'anomalies détectées. Le deuxième objectif de la thèse est la génération de règles interprétables et intelligibles par les experts pour la détection d’anomalies. Pour ceci, nous avons proposé un algorithme, Composition based Decision Tree (CDT), qui permet de produire automatiquement des règles ajustables et modifiables par les experts. Pour ce faire, nous avons conçu une modélisation variable des motifs de détection des points remarquables pour labéliser les séries temporelles. Sur la base de la série temporelle étiquetée, un arbre de décision est construit en considérant les nœuds comme des compositions de motifs. Enfin, l'arbre est converti en un ensemble de règles de décision, compréhensibles par les experts. Nous avons aussi défini une mesure de qualité pour les règles produites.