Extraction de connaissances de séries temporelles incertaines et cycliques : application à la locomotion en fauteuil roulant manuel
Auteur / Autrice : | Vanel Steve Siyou Fotso |
Direction : | Engelbert Mephu-Nguifo, Philippe Vaslin |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 11/12/2018 |
Etablissement(s) : | Université Clermont Auvergne (2017-2020) |
Ecole(s) doctorale(s) : | École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes |
Jury : | Président / Présidente : Karine Bennis-Zeitouni |
Examinateurs / Examinatrices : Laurence Chèze | |
Rapporteur / Rapporteuse : Florent Masseglia, Themis Palpanas, Wagner Jr. Meira |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse appréhende des questions scientifiques d'un point de vue de la data science, dans le cadre de l'analyse des séries temporelles issues de la locomotion en fauteuil roulant manuel (FRM). Compression et classification des séries temporelles à l'aide de DTW : l'algorithme Dynamic Time Warping (DTW) est souvent utilisé car il permet d'éviter de petites distorsions entre les séries temporelles au cours de leur alignement. Cependant, DTW produit parfois des alignements pathologiques qui se produisent, lorsque au cours de la comparaison de deux séries temporelles X et Y, un point de données de la série temporelle X est comparé à une grande sous-séquence de Y. Nous démontrons que la compression de séries temporelles à l'aide de l'approximation par morceaux (Piecewise Aggregate Approximation) (PAA) augmente considérablement la qualité de l'alignement avec DTW. Classification non supervisée de séries temporelles basée sur la distance Frobenius : Un shapelet non supervisé (U-shapelet) est une sous-séquence d'une série temporelle utilisée pour segmenter un jeu de données. Notre but est de découvrir des u-shapelets sur des séries temporelles incertaines. Pour ce faire, nous proposons un score de dissimilarité robuste à l'incertitude appelé FOTS dont le calcul est basé sur la décomposition en vecteurs propres et la comparaison des matrices d'autocorrélation de la série temporelle. Ce score est robuste à la présence d'incertitude ; il n'est pas très sensible aux changements transitoires ; il permet de saisir des relations complexes entre des séries temporelles telles que les oscillations et les tendances, et il est également bien adapté à la comparaison de séries temporelles courtes. Le score FOTS a été utilisé avec l'algorithme Scalable Unsupervised Shapelet Discovery pour le clustering de 17 jeux de données, et il a montré une amélioration substantielle de la qualité du clustering par rapport à l'indice Rand. Représentation symbolique de série temporelles cycliques basée sur les propriétés des cycliques : L'analyse des séries temporelles cycliques de la biomécanique est basée sur la comparaison des propriétés de leurs cycles. En général, les algorithmes de fouille de données ignorent cette particularité, nous proposons une représentation symbolique des séries temporelles cycliques basées sur les propriétés de cycles, appelés SAX-P. Les chaînes de caractères résultantes peuvent être comparées en utilisant la distance de distorsion temporelle dynamique (DTW). L'application de SAX-P aux moments propulsifs de trois sujets (S1, S2, S3) se déplaçant en FRM a mis en évidence de caractère asymétrique de leur propulsion. La représentation symbolique SAX-P facilite l'interprétation clinique des résultats de classification.