Méthodes d'estimation et d'estimation de variance pour une enquête longitudinale : application aux données de l'Etude Longitudinale Française depuis l'Enfance (Elfe)
Auteur / Autrice : | Hélène Juillard |
Direction : | Anne Ruiz-Gazen, Guillaume Chauvet |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 28/11/2016 |
Etablissement(s) : | Toulouse 1 |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Partenaire(s) de recherche : | Equipe de recherche : Toulouse School of Economics |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Dans ce document, on suppose que l’aléa provient du tirage de l’échantillon (inférence basée sur le plan de sondage). Chaque échantillonnage conduit à une variance dite d’échantillonnage. Après déroulement d’une enquête, l’estimation de cette variance va servir de mesure de précision (ou d’incertitude) pour les estimateurs des paramètres étudiés. La cohorte Elfe, démarrée en 2011, comprend plus de 18 000 enfants dont les parents ont donné leur consentement à l’inclusion. Dans chacune des maternités sélectionnées, les nourrissons de la population d’inférence nés durant quatre périodes spécifiques représentant chacune des quatre saisons de l’année 2011 ont été sélectionnés. Elfe est la première étude longitudinale de ce type en France, suivant les enfants de leur naissance à l’âge adulte. Elle aborde les multiples aspects de la vie de l’enfant sous l’angle des sciences sociales, de la santé et de la santé-environnement. La cohorte Elfe a été sélectionnée selon un plan de sondage non standard appelé échantillonnage produit, avec les sélections indépendantes d’un échantillon de maternités et d’un échantillon de jours. Le suivi de l’enfant commence dès ses premiers jours, à la maternité. Ensuite, lorsque les enfants fêtent leurs deux mois, les parents sont contactés pour un premier entretien téléphonique, puis au premier anniversaire des enfants, à leurs deux ans, 3 ans et demi et cinq ans et demi. L’enquête est longitudinale. Le premier chapitre de cette thèse introduit des notions relatives à la théorie des sondages et présente l’enquête Elfe (Etude Longitudinale Française depuis l’Enfance) ; ses données serviront d’illustration aux résultats théoriques issus de cette thèse. Le deuxième chapitre porte sur le plan produit et propose dans un cadre théorique général des estimateurs sans biais et des estimateurs simplifiés de variance pour traiter ce plan. Il est aussi montré que ce plan est en général moins efficace que celui classique à deux degrés d’échantillonnage. Le chapitre trois est en continuité avec le précédent : pour le plan produit, cinq estimateurs sans biais de type Yates-Grundy sont proposés à partir de cinq différentes décompositions possibles de la variance. Le chapitre quatre est un article permettant au lecteur de différencier le plan produit du plan à deux degrés, et de mettre en pratique les étapes d’échantillonnage et d’estimation sous les logiciels R, SAS et Stata. Le chapitre cinq est lui, consacré à la variance et l’estimation de la variance pour une enquête de type cohorte avec processus de non-réponse monotone. Le chapitre six est un rapport méthodologique pour les utilisateurs où l’estimation de la variance appropriée au plan Elfe est expliquée et mise en œuvre avec les logiciels R, SAS et Stata. Tous les résultats des études par simulation présentés dans ce document sont reproductibles, les codes étant proposés en annexe.