Modèles hiérarchiques et topologiques pour le partitionnement et la visualisation des données.
Auteur / Autrice : | Nhat-quang Doan |
Direction : | Mustapha Lebbah |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 04/01/2011 Soutenance le 09/12/2013 |
Etablissement(s) : | Paris 13 |
Ecole(s) doctorale(s) : | Ecole doctorale galilée |
Résumé
Cette thèse se concentre sur les approches hiérarchiques et topologiques pour le clustering et la visualisation de données.Le problème du clustering devient de plus en plus compliqué en raison de présence de données structuréessous forme de graphes, arbres ou données séquentielles. Nous nous sommes particulièrement intéressés aux cartes auto-organisatrices et au modèle hiérarchique AntTree qui modélise la capacité des fourmis réelles. En combinant ces approches, l'objectif est de représenter les données dans une structure hiérarchique et topologique. Ce combiné permet de visualiser les résultats de clustering sous forme de plusieurs arbres organisés sur une carte topologique. Dans ce rapport, nous présentons trois modèles, dans le premier modèle, nous montrons l'intérêt d’utiliser les structures hiérarchiques et topologiques sur des ensembles de données structurés sous formede graphes. Le second modèle est une version incrémentale qui n'impose pas de règles sur la préservation de la topologie. Le troisième modèle aborde notamment la problématique de la sélection de variables en utilisant la structure hiérarchique, nous proposons un nouveau score pour sélectionner les variables pertinentes en contraignant le score Laplacien. Enfin, cette thèse propose plusieurs perspectives pour des travaux futurs.