Thèse soutenue

Méthodes d’apprentissage statistique de type « Transfer Learning » pour des données temporelles multivariées

FR  |  
EN
Auteur / Autrice : Guillaume Richard
Direction : Nicolas VayatisMathilde MougeotGeorges Hébrail
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 07/10/2021
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Centre de mathématiques et de leurs applications (1990-2019 ; Cachan, Val-de-Marne) - Centre Borelli (Gif-sur-Yvette, Essonne ; 2020-...)
Equipe de recherche : Apprentissage statistique et données massives
Référent : École normale supérieure Paris-Saclay (Gif-sur-Yvette, Essonne ; 1912-....)
graduate school : Université Paris-Saclay. Graduate School Mathématiques (2020-….)
Jury : Président / Présidente : Younès Bennani
Examinateurs / Examinatrices : Nicolas Vayatis, Mathilde Mougeot, Georges Hébrail, Gianluca Bontempi, Michèle Sebag, Jairo Cugliari
Rapporteurs / Rapporteuses : Younès Bennani, Gianluca Bontempi

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans ce travail, nous proposons de nouvelles méthodes d'apprentissage par transfert pour l'analyse des séries temporelles. Motivés par des applications de désagrégation de la consommation d'électricité des ménages (NILM) et de surveillance de systèmes industriels, nous mettons en lumière le besoin de méthodes spécifiques d'apprentissage par transfert pour les séries temporelles. Après avoir examiné les méthodes existantes d'apprentissage par transfert et d'adaptation de domaine, nous formulons le problème suivant : pouvons-nous extraire des représentations de séries temporelles transférables à de nouveaux jeux de données ? Ansi, notre objectif est de proposer un ensemble de méthodes permettant de transférer une partie des connaissances apprises sur un échantillon de données temporelles sources vers un nouvel échantillon cible ayant des propriétés différentes.Dans une première partie, nous étudions les représentations des séries temporelle utilisant des réseaux de neurones avec pour objectif la reconnaissance d'appareils électroménagers à partir de leur consommation. Nous proposons une méthode de mélange de normalisations permettant une meilleur robustesse à un changement de maison, et donc d'appareils, entre l'apprentissage et l'application du réseau de neurone.Dans une deuxième partie, nous développons un cadre général pour l'adaptation de domaine adverse, s'appliquant aussi bien à des problèmes de classification que de régression. Nous proposons des garanties théoriques et un algorithme d'adaptation de domaine avec plusieurs sources. Bien que l'application principale de la méthode présentée dans ce travail soit un problème de régression, notre cadre est générique et s'applique à la classification. Nos expériences, menées sur des données privées et publiques, montrent l'efficacité de notre méthode.Dans une dernière partie, nous étudions les méthodes d'apprentissage par transfert pour les séries temporelles multivariées se basant sur des leurs matrices de covariance. En représentant les séries temporelles multivariées par leur matrice d'autocovariance, nous développons un cadre d'adaptation de domaine en utilisant la géométrie spécifique de ces matrices.