Prédiction de données de séries chronologiques avec des méthodes basées sur la régression à vecteurs de support dans des conditions environnementales et opérationnelles stationnaire/non-stationnaire
Auteur / Autrice : | Jie Liu |
Direction : | Enrico Zio |
Type : | Thèse de doctorat |
Discipline(s) : | Génie industriel |
Date : | Soutenance le 12/02/2015 |
Etablissement(s) : | Châtenay-Malabry, Ecole centrale de Paris |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'Ingénieur (Châtenay-Malabry, Hauts de Seine) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire génie industriel (Gif-sur-Yvette, Essonne) |
Jury : | Président / Présidente : Saïd Noureddine Zerhouni |
Examinateurs / Examinatrices : Enrico Zio, Cesare Alippi, Pierre Dersin, Christian Derquenne | |
Rapporteurs / Rapporteuses : Saïd Noureddine Zerhouni, Cesare Alippi |
Mots clés
Résumé
Ce travail de thèse est motivée par la possibilité de surveiller l'état des composants de systèmes d'énergie pour leur utilisation prolongée et sécuritaire, conformément à la pratique correcte de fonctionnement et des politiques adéquates de maintenance. La motivation est de développer des méthodes basées sur la régression à vecteurs de support pour la prédiction de données de séries chronologiques dans des conditions environnementales et opérationnelles stationnaire/ non-stationnaire. Les simples modèles et les ensembles de modèles à base de SVR sont développés pour attaquer la prédiction basée sur des petits et des grands ensembles de données. Des stratégies sont proposées pour la mise à jour de façon adaptative les simples modèles et les ensembles de modèles à base de SVR au cas du changement de la distribution générant les données. Les comparaisons avec d'autres méthodes d'apprentissage en ligne sont fournies en référence à des données de séries chronologiques d'un composant critique dans les centrales nucléaires fournis par Electricité de France (EDF). Les résultats montrent que les approches proposées permettent d'atteindre des résultats de prédiction comparables compte tenu de l'erreur quadratique moyenne et erreur relative, en beaucoup moins de temps de calcul. Par ailleurs, en analysant le sens géométrique de la méthode de la sélection de vecteurs caractéristiques(FVS) proposé dans la littérature, une nouvelle méthode géométriquement interprétable, nommé Reduced RankKernel Ridge Regression-II (RRKRR-II), est proposée pour décrire les relations linéaires entre un valeur prédite et les valeurs prédites des vecteurs caractéristiques sélectionné par FVS. Les comparaisons avec plusieurs méthodes sur un certain nombre de données publics prouvent la bonne précision de la prédiction et le réglage facile des hyperparamètres de RRKRR-II.