Thèse soutenue

La mise en oeuvre des modèles statistiques linéaires et non linéaires en sciences de l'environnement

FR  |  
EN
Auteur / Autrice : Ioannis Dimopoulos
Direction : Jacques Lauga
Type : Thèse de doctorat
Discipline(s) : Biométrie et environnement
Date : Soutenance en 1997
Etablissement(s) : Toulouse 3

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Ce travail etudie quelques approches, difficultes et questions portant sur les differentes etapes de la mise en uvre d'un modele statistique. Il presente d'abord quelques analyses permettant d'obtenir une premiere idee de la classe de modeles a laquelle celui qui est recherche a le plus de chance d'appartenir. Il s'interesse ensuite au probleme de la selection d'un modele parmi plusieurs candidats. Deux grandes classes de methodes permettant cette selection sont discutees. Les methodes de la premiere classe sont basees sur une estimation de la performance du modele en generalisation, tandis que celles de la seconde sont basees sur certaines hypotheses a priori sur la complexite du modele dont la satisfaction pourrait conduire a une bonne performance en generalisation. On montre que la difficulte des methodes de selection croit avec la capacite d'approximation du modele. Trois types de modeles sont etudies : - les modeles lineaires avec estimation recursive des parametres permettant de tenir compte de non-stationnarites. Le probleme de l'estimation des parametres est aborde par plusieurs methodes et illustre avec un exemple de prediction des debits. - les perceptrons multicouches, ayant une grande capacite d'approximation de relations fortement non-lineaires. Les problemes que posent les choix necessaires a leur utilisation correcte sont discutes. Les raisons pour lesquelles ils ne peuvent etre encore consideres comme un outil banalise sont expliquees. La methodologie de leur application est presentee avec deux exemples de modelisation de donnees reelles permettant de montrer qu'ils doivent etre utilises dans un contexte statistique. - les modeles locaux, bien que localement de forme simple, peuvent montrer une grande capacite d'approximation. Leur validite et leur capacite predictive sont etroitement liees au choix de parametres qui definissent l'etendue du voisinage d'approximation locale. Une nouvelle methode de determination d'un voisinage localement variable est proposee. Cette methode permet de determiner automatiquement une etendue localement optimale et d'utiliser les variations locales de cette etendue pour caracteriser la dynamique du systeme etudie. La validite de la methode est evaluee sur plusieurs ensembles de donnees.