Thèse soutenue

Vers des Méthodes Robustes d'Apprentissage Profond pour les Données de Séries Temporelles et leurs Applications

FR  |  
EN
Auteur / Autrice : Chrysoula Kosma
Direction : Michalis Vazirgiannis
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 27/11/2023
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de l'École polytechnique (Palaiseau, Essonne) - Laboratoire d'informatique de l'École polytechnique [Palaiseau] / LIX
Jury : Président / Présidente : Catuscia Palamidessi
Examinateurs / Examinatrices : Michalis Vazirgiannis, Laurent Oudre, Germain Forestier, Vasileios Megalooikonomou, Yang Yang, Themis Palpanas, Fragkiskos Malliaros
Rapporteurs / Rapporteuses : Laurent Oudre, Germain Forestier

Résumé

FR  |  
EN

Les données de séries temporelles sont abondantes dans divers domaines, notamment la finance, l’énergie et les réseaux sociaux. L’extraction de connaissances à partir des séries temporelles, pour effectuer des tâches ultérieures telles que la prévision, l’interpolation et la classification, est donc devenue essentielle dans plusieurs domaines scientifiques et industriels. Les modèles d’apprentissage profond (deep learning - DL), c’est-à-dire les réseaux neuronaux, se sont révélés être des outils puissants dans diverses applications de données, car ils fournissent des méthodes flexibles pour l’extraction de connaissances et peuvent facilement apprendre à partir de sources de données multiples. Cependant, les modèles d’apprentissage profond nécessitent généralement de grands ensembles de données pour une meilleure généralisation et manquent souvent d’interprétabilité, de sorte que leur application industrielle reste limitée. En ce qui concerne plus particulièrement la modélisation des séries temporelles, l’adaptabilité des réseaux neuronaux à la dynamique à temps continu de ces données reste une question ouverte. En outre, l’origine des réseaux neuronaux dans des tâches séquentielles discrètes, comme l’analyse de texte, limite leur compréhension des propriétés complexes des séries dépendant du temps. Pour combler cette lacune, il est essentiel d’évaluer systématiquement l’efficacité des architectures DL en fonction de diverses caractéristiques et distorsions des séries temporelles. Les distorsions des séries temporelles englobent des facteurs extrinsèques, tels que des observations bruyantes et un échantillonnage irrégulier. En outre, les caractéristiques intrinsèques, telles que les fortes corrélations inter-variables et inter- temporelles et la connaissance préalable (contraintes imposées) de la dynamique sous-jacente, sont prédominantes parmi les différents ensembles de données de séries temporelles. Cependant, les distorsions extrinsèques et les caractéristiques intrinsèques posent des défis importants à la modélisation robuste des séries temporelles par l’apprentissage profond. L’étude actuelle évalue de manière critique la performance des modèles d’apprentissage profond existants face à ces défis et propose également de nouvelles approches de modélisation. Celles-ci comprennent la conception de fonctions de perte pour la prévision qui sont robustes au bruit, l’extension des architectures neuronales conventionnelles pour l’échantillonnage irrégulier et le développement d’algorithmes qui capturent des enchâssements descriptifs de dépendances temporelles et inter-variables complexes. En outre, notre étude comprend des applications aux données spatio-temporelles et aux systèmes dynamiques avec des modèles informés par la physique pour tirer parti des connaissances antérieures. Par conséquent, cette thèse fournit une analyse complète des approches modernes de DL pour la modélisation des séries temporelles et leurs limites, ainsi que quelques nouvelles contributions. Nous espérons que les sujets explorés ainsi que les méthodes proposées constituent des voies prometteuses pour améliorer de manière significative la robustesse de la modélisation automatique et neuronale des séries temporelles.