Thèse soutenue

Techniques d'estimations et méthodes factorielles : exposé formel et application aux traitements de données lexicométriques

FR  |  
EN
Auteur / Autrice : Eric Brian
Direction : Ludovic Lebart
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance en 1986
Etablissement(s) : Paris 11
Partenaire(s) de recherche : Autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)
Jury : Président / Présidente : Didier Dacunha-Castelle
Examinateurs / Examinatrices : Ludovic Lebart, Michel Métivier, Alain Morineau, Jean L. Bretagnolle, Didier Dacunha-Castelle

Résumé

FR  |  
EN

Cette thèse se décompose en deux temps, le premier est consacré à une justification probabiliste des résultats de la statistique descriptive, et notamment de l'analyse des correspondances, le second à une programmation de l'application de ces techniques, et principalement de l'agrégation, aux variables manipulées dans la léxicométrie. 1- L'application des techniques de validation par ré-échantillonnage aux méthodes de statistique descriptive (qu'on justifie généralement par des démonstrations algébriques) pose le problème de leur démonstration probabiliste. Considérer une carte factorielle comme une estimation impose une formalisation de l'échantillonnage plus complexe que d'habitude. Dans ce cadre, un certain nombre de résultats classiques sont redémontrés. 2- Dans la logique du système de programmes SPAD, des programmes d'agrégation utilisables avec des comptages d'occurrences (comme en lexicométrie) sont proposés. Leur conception pose des problèmes de choix de distance et d'algorithmes. Les textes FORTRAN sont donnés ainsi que plusieurs exemples illustrant la stabilité de la méthode retenue. Il est possible d'appliquer ces programmes au codage automatique des questions ouvertes d'enquêtes à partir de la saisie des « réponses brutes ».