Thèse soutenue

Extension des méthodes d'analyse factorielle à des données de type intervalle

FR  |  
EN
Auteur / Autrice : Ahlame Douzal-Chouakria
Direction : Pierre CazesEdwin Diday
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1998
Etablissement(s) : Paris 9

Résumé

FR

L’analyse factorielle permet d’extraire, à partir de données nombreuses, les tendances les plus marquantes. A l’aide de représentations graphiques, elle visualise des groupements, des oppositions, des tendances, impossibles à discerner directement sur un tableau de données. L’objectif de ce travail est d’étendre, deux méthodes en analyse factorielle, l’analyse en composantes principales et l’analyse des correspondances multiples, à des données de type intervalle. Dans la première partie de ce travail, on présente une extension de l’analyse en composantes principales à des données de type intervalle, mu nies éventuellement de contraintes de domaines. On propose deux nouvelles approches : la méthode des sommets et la méthode des centres. L’inertie prise en compte par chacune de ces méthodes est analysée puis comparée. Les paramètres d’aide à l’interprétation sont généralisés aux données intervalles. La visualisation ponctuelle des individus, dans les plans factoriels, se traduit ici par une visualisation de rectangles, segments ou points. On propose une procédure itérative qui fournit une visualisation des objets à différents niveaux de qualité de représentation. D’une part, on confronte dans un cadre probabiliste la méthode des sommets et la méthode des centres. D’autre part, on établit un rapprochement entre la méthode des sommets, la méthode Statis et l’analyse factorielle discriminante. Dans une deuxième partie, on s’intéresse à l’extension de l’analyse des correspondances multiples à des données intervalles. On propose trois techniques de codage de variables de type intervalle : le codage croisé, le codage par sommets et le codage sans décomposition. Les deux premières techniques se basent sur la décomposition des variables intervalles en variables numériques. La dernière technique se base sur l’extension d’outils de codage des variables numériques (fonction de répartition, histogramme, fonction d’appartenance, etc. ) à des données intervalles