Thèse soutenue

Apprentissage métrique pour l'analyse des séries temporelles multivariées utilisant DTW : application à la télédétection et au génie logiciel
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Abdoul-Djawadou Salaou
Direction : Pierre GançarskiDaniela Damian
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 17/12/2020
Etablissement(s) : Strasbourg en cotutelle avec University of Victoria (British Columbia, Canada)
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences de l'information et de l'ingénieur (Strasbourg ; 1997-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (Strasbourg)
Jury : Président / Présidente : Cédric Wemmert
Examinateurs / Examinatrices : Alex Thomo, Germain Forestier
Rapporteurs / Rapporteuses : Ian Davidson, Antoine Cornuéjols

Résumé

FR  |  
EN

Dans le contexte où les données sont de plus en plus abondamment disponibles, les Séries Temporelles sont essentielles pour extraire et comprendre l’évolution des phénomènes naturels, artificiels, socio-économiques sous-jacents. La littérature dans ce domaine a largement démontré que l’algorithme de déformation dynamique du temps (Dtw), associée à une certaine distance locale/de base δ (par exemple, la distance euclidienne), est une mesure de similarité efficace pour analyser des ST univariées. Cependant, le couplage statistique possible entre les différentes dimensions rend la généralisation de cette mesure au cas multivarié tout sauf évidente. En pratique, les ST multivariées sont décrites par des attributs hétérogènes qui mettent généralement en évidence différents motifs relationnels (attributs corrélés, bruités, manquants ou non pertinents). Par conséquent, pour obtenir une comparaison « adéquate » des données, DTW a besoin d’un δ qui « comprend » l’espace des données. En effet, à mesure que la complexité des données augmente, il devient très difficile de définir une telle distance de base satisfaisante δ. Il semble totalement irréaliste de définir δ manuellement ou sur la seule base d’un avis d’expert. Cela a suscité notre intérêt pour la définition d’une nouvelle distance capable de saisir de telles dépendances inter-dimensionnelles par le biais de l’Apprentissage Métrique de Distance. L’AMD consiste à apprendre une métrique pour mieux discriminer les données en accentuant la relation de distance entre des objets considérés comme (fortement) similaires, ou à l’inverse (fortement) dissimilaires. Cette information sur la (dis)similarité est souvent fournie au moyen de contraintes must-link et cannot-link entre les objets. Toutefois, dans le cas de données volumineuses et complexes, fournir de telles contraintes reste un problème ouvert. Aussi, nous proposons une méthode, basée sur canopy clustering, pour extraire automatiquement les contraintes du jeu de données.