Thèse soutenue

Statistique du modele lineaire avec donnees incompletes

FR  |  
EN
Auteur / Autrice : David Causeur
Direction : Jean Deshayes
Type : Thèse de doctorat
Discipline(s) : Mathématiques et applications
Date : Soutenance en 1997
Etablissement(s) : Rennes 1

Résumé

FR

L'ensemble des problemes statistiques que l'on etudie repose sur la prise en compte, dans le modele lineaire multivariable, de l'absence partielle de donnees. On distingue essentiellement deux contextes pour lesquels la generation de donnees incompletes est de nature differente. Le premier cas, dans lequel l'absence de donnees est accidentelle, fait le plus souvent figure de cas generique. Le second cas, dans lequel l'absence de donnees est intentionnelle, pose le probeme de la prise en compte des couts experimentaux dans la planification de l'echantillonnage. Dans un premier temps, l'estimation des parametres du modele lineaire pour une configuration simple de donnees incompletes fait l'objet d'une etude detaillee dans un cadre non-asymptotique permettant de degager des strategies exactes de planification d'echantillonnage. On deduit ensuite de la caracterisation de l'optimalite, au sens de l'estimation lineaire des parametres de modeles mixtes, une alternative aux methodes d'estimation basees sur la vraisemblance gaussienne plus performante dans le contexte d'echantillons de petite taille. On generalise les resultats precedents a des configurations de donnees manquantes complexes autorisant une optimisation plus fine du plan d'echantillonnage. Enfin, la calibration de variables predictrices dans des modeles de regression lineaire est etudiee par l'intermediaire d'un parallele avec une configuration tres particuliere de donnees manquantes dans le modele lineaire multivariable.