Techniques d'estimations et méthodes factorielles : exposé formel et application aux traitements de données lexicométriques
Auteur / Autrice : | Eric Brian |
Direction : | Ludovic Lebart |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance en 1986 |
Etablissement(s) : | Paris 11 |
Partenaire(s) de recherche : | Autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) |
Jury : | Président / Présidente : Didier Dacunha-Castelle |
Examinateurs / Examinatrices : Ludovic Lebart, Michel Métivier, Alain Morineau, Jean L. Bretagnolle, Didier Dacunha-Castelle |
Résumé
Cette thèse se décompose en deux temps, le premier est consacré à une justification probabiliste des résultats de la statistique descriptive, et notamment de l'analyse des correspondances, le second à une programmation de l'application de ces techniques, et principalement de l'agrégation, aux variables manipulées dans la léxicométrie. 1- L'application des techniques de validation par ré-échantillonnage aux méthodes de statistique descriptive (qu'on justifie généralement par des démonstrations algébriques) pose le problème de leur démonstration probabiliste. Considérer une carte factorielle comme une estimation impose une formalisation de l'échantillonnage plus complexe que d'habitude. Dans ce cadre, un certain nombre de résultats classiques sont redémontrés. 2- Dans la logique du système de programmes SPAD, des programmes d'agrégation utilisables avec des comptages d'occurrences (comme en lexicométrie) sont proposés. Leur conception pose des problèmes de choix de distance et d'algorithmes. Les textes FORTRAN sont donnés ainsi que plusieurs exemples illustrant la stabilité de la méthode retenue. Il est possible d'appliquer ces programmes au codage automatique des questions ouvertes d'enquêtes à partir de la saisie des « réponses brutes ».