Thèse soutenue

Contribution à la classification de données binaires et qualitatives

FR  |  
EN
Auteur / Autrice : Franck Marchetti
Direction : Gérard Govaert
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1989
Etablissement(s) : Metz

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Dans ce travail, nous étudions des méthodes de classification automatique spécifiques aux données binaires et qualitatives nominales et ordinales. A chaque fois, nous essayons de rester proche de la forme et de la structure initiale des données. Ces méthodes fournissent des partitions optimisant un critère défini à partir de la distance en valeurs absolues ou distance L1. Cette approche permet d'aboutir à des résultats facilement interprétables par rapport aux données initiales. Nous définissons ensuite une inertie sur l'espace binaire muni de la distance L1. Cette inertie binaire se comporte comme l'inertie habituelle : une relation de type Huyghens et une relation de décomposition de l'inertie sont démontrées. La méthode de classification et la méthode de classification croisée pour tableaux de variables binaires peuvent ainsi être replacées dans un contexte plus habituel. Elles optimisent respectivement un critère d'inertie intraclasse et une mesure d'information. Une extension à la classification ascendante hiérarchique est également envisagée. Ensuite, toujours en restant proche des données initiales, une analyse en composantes principales pour données binaires est construite. Celle-ci recherche un ensemble d'axes factoriels binaires et permet de mettre en évidence des sous-tableaux homogènes. Enfin, un bilan des méthodes pour tableaux binaires est effectué. Toutes les méthodes proposées ici ont été programmées et intégrées au logiciel d'analyse de données SICLA (système interactif et classification automatique, INRIA)