Estimation par ondelettes pour des données longitudinales

par Trung Tu Nguyen

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Dominique Picard.

Soutenue en 2011

à Paris 7 .


  • Résumé

    Cette thèse traite principalement des problèmes d'analyse des données longitudinales. Dans le cadre de l'estimation non paramétrique, une technique particulièrement intéressante consiste à utiliser des bases d'ondelettes. Le but de cette thèse est d'obtenir de bonnes procédures d'estimation par ondelettes pour des données longitudinales. Lors d'une analyse des données longitudinales, nous recevons régulièrement des observations d'un ensemble d'individus mesurées en temps aléatoires. Les études récentes montrent que les corrélations entre des observations d'un même individu portent des informations importantes et ne peuvent plus être négligeables comme dans les modèles classiques. Il est certes intéressant de tenir compte de ces corrélations mais elles posent des problèmes techniques difficiles à gérer. Dans de telles circonstances, serait-il possible d'adopter des outils classiques ? Quelles sont les hypothèses nécessaires pour bien analyser ces données ? Comment interviennent-elles les corrélations dans la performance de ces études ? Pouvons-nous toujours avoir des procédures adaptatives qui ne demandent pas d'informations a priori ? Les résultats établis dans cette thèse permettent de répondre à ces questions. Dans le cadre de notre travail, nous considérons deux modèles longitudinaux : le modèle général et le modèle linéaire longitudinal. Nous travaillons principalement sur le modèle général pour lequel nous proposons un schéma d'estimation qui contient plusieurs étapes. Ces différentes étapes de seront explicitées successivement dans les chapitres 3, 4 et 5. Le chapitre 6 présentera les résultats pour le modèle linéaire longitudinal. Chaque chapitre correspond à une ou plusieurs réponses aux questions précédentes. Au sein du chapitre 3, nous apporterons des procédures d'estimation linéaires de deux fonctions essentielles (la moyenne et la covariance) de l'approche ACP. Dans cette étape, l'intervention des corrélations dans la performance se présente comme une nouvelle borne du risque quadratique. L'estimation par ondelettes est particulièrement bien adaptée pour résoudre les difficultés techniques générées par l'autocorrélation. Sous les hypothèses gaussiennes, nous pouvons montrer que la procédure d'estimation est optimale sur le plan minimax. Les chapitres 4 et 5 proposeront des procédures d'estimation adaptatives par la méthode de seuillage en ondelettes. Dans cette étape, nous étudions les deux cas du modèle : borné et gaussien. Concernant l'estimation de la moyenne, un cas intéressant - le cas brownien - sera examiné dans la section 4. 3. 3. Une comparaison numérique avec la méthode localement linéaire sera faite dans la section 4. 4. Le chapitre 5 terminera notre schéma par l'estimation de la covariance, toujours pour les deux cas considérés. Chacun de ces chapitres peut être lu indépendamment les uns des autres. Les résultats principaux seront résumés dans le chapitre 2. Une brève introduction sur les données longitudinales, les méthodes classiques et l'approche principale est présentée dans le chapitre 1.

  • Titre traduit

    Wavelet estimations for longitudinal data


  • Résumé

    This thesis mainly deals with problems of analysis of longitudinal data. In the context of nonparametric estimation, a technique particularly interesting consists of wavelet estimation methods. This thesis proposes wavelet estimation procedures for longitudinal data and studies their asymptotical properties. Generally, in longitudinal data analysis, we regularly collect data, measured from a group of individuals in random times. Recent studies show that the autocorrelations of the observations (of the same subject) should be taken into account to draw valid scientific inferences. It is essential to consider these autocorrelation, but they pose difficult technical problems to manage when we analyze the asymptotic behaviors of the estimation procedures. In such circumstances, would it be possible to adopt the standard non-parametric estimation tools? What assumptions are needed to properly analyze these data? How do the correlations behave in the asymptotical properties? Is there any adaptive estimation procedure that does not require any priori information? The results established in this thesis help answering these questions. Two longitudinal models: the general model and the longitudinal linear model are considered in our work. The main results are studied for the general model in which a completed estimation scheme, containing separated steps, is proposed. These different steps will be explained successively in chapters 3, 4 and 5. Chapter 6 will present the results for the longitudinal linear model. Each chapter corresponds to one or more answers to the previous questions. In chapter 3, a linear procedure is studied to estimate two essential fonctions (mean and covariance) of thé PCA approach. In this case, the impact of the autocorrelations is presented as a new component of the quadratic risk. Wavelet estimation methods are particularly well suited to solve the technical difficulties generated by the autocorrelation. Moreover, under Gaussian assumptions, our estimation procedures are clearly proved to be optimal in the minimax sense. Chapters 4 and 5 propose adaptive estimation procedures by using wavelet shrinkage methods. In this step, we study two separated cases of the model: when the unknown random process is bounded or Gaussian. Furthermore, the case Brownian is discussed in Section 4. 3. 3. A numerical comparison with the locally linear method will be made in Section 4. 4. Chapter 5 will complete our scheme by estimating the covariance function, consecutively for these two previous cases. Each of these chapters could be read independently of each other. The main results are summarized in Chapter 2. A brief introduction of longitudinal data, conventional methods and the main approach is presented in Chapter 1.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (136 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 100 réf.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • PEB soumis à condition
  • Cote : TS (2011) 001

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Sorbonne Université. Bibliothèque de Sorbonne Université. Bibliothèque Géosciences et environnement.
  • Disponible pour le PEB
  • Cote : 11 PA07 7001
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.