Exploration de grands ensembles de motifs.
Auteur / Autrice : | Marie Ndiaye |
Direction : | Arnaud Giacometti, Cheikh Talibouya Diop |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 20/12/2010 |
Etablissement(s) : | Tours en cotutelle avec Université de Saint-Louis (Sénégal) |
Ecole(s) doctorale(s) : | Ecole doctorale Santé, sciences, technologies (Tours) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...) |
Laboratoire : École polytechnique universitaire (Tours) | |
Jury : | Président / Présidente : Karine Zeitouni |
Examinateurs / Examinatrices : Arnaud Soulet | |
Rapporteur / Rapporteuse : Anne Laurent, Jean Marc Petit |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L'abondance des motifs générés par les algorithmes d'extraction de connaissances représente un grand problème dans le domaine de fouille de données. Afin de faciliter l'exploration de ces motifs,deux approches sont souvent utilisées : la première consiste à résumer les ensembles de motifs extraits et la seconde approche repose sur la construction de représentations visuelles de ces motifs. Cependant, les résumés ne sont pas structurés et ils sont proposés sans méthode d'exploration. D'autre part, les représentations visuelles n'offrent pas une vue globale des ensembles de motifs. Nous définissons un cadre générique qui combine les avantages des ces deux approches.Il permet de construire des résumés d'ensembles de motifs à plusieurs niveaux de détail. Ces résumés donnent une vue globale des ensembles de motifs. De plus, ils sont structurés sous forme de cubes sur lesquels des opérateurs de navigation OLAP peuvent être appliqués pour explorer les ensembles de motifs. Par ailleurs, nous proposons un algorithme qui fournit un résumé de bonne qualité dont la taille est inférieure à un seuil donné. Enfin, nous instancions notre cadre avec les règles d'association.