Thèse soutenue

Algorithmique des treillis de concepts : application à la fouille de données

FR  |  
EN
Auteur / Autrice : Huaiguo Fu
Direction : Engelbert Mephu-Nguifo
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2005
Etablissement(s) : Artois

Résumé

FR  |  
EN

Dans cette thèse, nous nous intéressons à la structure du treillis de concepts et à ses applications à la fouille de données. Nous avons entrepris dans cette thèse un travail de comparaison de plusieurs algorithmes de génération des concepts formels sur les données d'UCI. Au cours de cette étude, nous avons analysé le phénomène de la dualité objets/attributs sur les performances des algorithmes. Nous proposons un nouvel algorithme de génération de concepts formels, nommé ScalingNextClosure. ScalingNextClosure décompose l'espace de recherche en partitions, et génère de manière indépendante les concepts pour chaque partition. Cette technique de décomposition et d'indépendance des partitions lui permet de gérer efficacement la mémoire centrale et les entrées/sorties pour être capable de traiter efficacement des contextes de données volumineux. Une comparaison expérimentale montre l'efficacité de cet algorithme par rapport à NextClosure. L'indépendance des partitions est un atout pour la mise en oeuvre de ScalingNextClosure dans un environnement parallèle et distribué. En fouille de données, la problématique d'extraction des itemsets fermés fréquents pour la recherche de règles d'association, se prête bien à une mise en oeuvre de ScalingNextClosure. Nous avons donc étendu ScalingNextClosure pour traiter ce problème. Le nouvel algorithme, nommé PFC, utilise la mesure du support pour élaguer l'espace de recherche dans une partition. Une comparaison expérimentale avec une des méthodes les plus efficaces actuellement, a été réalisée sur une architecture séquentielle, et donne des résultats encourageants.