Thèse soutenue

Methodes statistiques et informatiques pour le traitement de donnees manquantes

FR  |  
EN
Auteur / Autrice : VILA CO
Direction : Gilbert Saporta
Type : Thèse de doctorat
Discipline(s) : Sciences et techniques communes. Sciences appliquées
Date : Soutenance en 1997
Etablissement(s) : Paris, CNAM

Résumé

FR

En pratique, la presence des donnees manquantes est tres frequente. En l'absence du traitement approprie, des statistiques qui n'en tiendraient pas compte seraient fortement biaisees. Cette these est consacree a des methodes de traitement de donnees manquantes, en particulier qualitatives. Nous nous interessons a la methode de l'analyse homogene, developpee par des chercheurs neerlandais, qui peut reconstituer des donnees manquantes qualitatives du type non completement aleatoires. Comme l'analyse en composantes principales (a. C. P. ) et la classification automatique sont deux techniques frequemment employees dans le depouillement d'enquete, nous avons mis au point une methode pour l'a. C. P. Et une autre pour la classification automatique avec des donnees incompletes. Les resultats sont valides par reconstitution de donnees connues mais cachees, dans des cas reels et simules. La deuxieme partie de la these est consacree a la fusion des fichiers. C'est un outil indispensable pour rassembler des informations provenant de differentes sources. La methode de l'analyse homogene y est importee et adaptee a la fusion des fichiers. L'evaluation de la methode est faite simultanement sur des donnees reelles et simulees.