Thèse soutenue

Modèles hybrides intégrant des réseaux de neurones artificiels à des modèles de chaînes de Markov cachées : application à la prédiction de séries temporelles

FR  |  
EN
Auteur / Autrice : Joseph Rynkiewicz
Direction : Marie Cottrell
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance en 2000
Etablissement(s) : Paris 1

Résumé

FR

L'objet de cette thèse est la modélisation et la prédiction de séries temporelles par l'utilisation jointe de perceptrons multicouches (MLP) et de chaînes de Markov cachées (HMM). Après un rappel de quelques résultats fondamentaux sur les MLP, nous discutons empiriquement d'une méthode d'estimation et d'initialisation des paramètres (poids) du MLP par recuit simulé. Puis, nous étudions l'estimation des paramètres d'un modèle autorégressif non-linéaire dans le cadre des séries multidimensionnelles. Nous montrons que la fonction de contraste à minimiser dans ce cas est le logarithme du déterminant de la matrice de covariance empirique, puisque cela correspond au maximum de vraisemblance pour un bruit gaussien. On montre que, sous de bonnes conditions de régularité du modèle et sans hypothèse de normalité du bruit, ce contraste a de bonnes propriétés statistiques et nous en déduisons, sous des hypothèses raisonnables, qu'un contraste pénalisé de type BIC est fortement consistant. Nous étudions ensuite les modèles HMM/MLP ou modèles autorégressifs à changements de régime markoviens. Après avoir montré le bon comportement de ce modèle sur une série de laboratoire (série laser), nous étudions les différentes façons d'estimer les paramètres de ces modèles à l'aide de l'estimateur du maximum de vraisemblance (EMV). Généralisant la méthode d'Elliott, nous proposons un algorithme E. M. Ne nécessitant qu'une récurrence avant et autorisant alors une implémentation en ligne, de l'algorithme. Puis, nous montrons qu'une approche plus directe, c'est-à-dire un calcul effectif de la dérivée de la log-vraisemblance donne un algorithme plus performant. Nous étudions alors les propriétés statistiques de l'EMY. Après avoir rappelé les conditions d'existence d'une solution stationnaire générée par ce modèle, nous démontrons la consistance, puis la normalité asymptotique de cet estimateur. Finalement nous utilisons ce modèle pour améliorer les prévisions du taux de pollution en niveau d'ozone dans l'air parisien.