Aide à l'utilisation et à l'exploitation de l'analyse de concepts formels pour des non-spécialistes de l'analyse des données
Auteur / Autrice : | Ali Jaffal |
Direction : | Bénédicte Le Grand, Manuele Kirsch Pinheiro |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 03/10/2019 |
Etablissement(s) : | Paris 1 |
Ecole(s) doctorale(s) : | École doctorale de Management Panthéon-Sorbonne (Paris ; 2012-....) |
Partenaire(s) de recherche : | Equipe de recherche : Centre de recherche en informatique (Paris ; 1986-....) |
Laboratoire : Centre de recherche en informatique (Paris ; 1986-....) | |
Jury : | Président / Présidente : Christine Largeron |
Examinateurs / Examinatrices : Bénédicte Le Grand, Manuele Kirsch Pinheiro | |
Rapporteurs / Rapporteuses : Florence Sèdes, Michel Soto |
Mots clés
Résumé
De nombreuses approches ont été élaborées pour extraire des connaissances à partir des données. On distingue traditionnellement l’analyse descriptive et l’analyse prédictive. Nous nous focalisons dans cette thèse sur l’analyse descriptive des données et plus particulièrement sur l’Analyse de Concepts Formels (ACF), qui permet de construire des clusters recouvrants (appelés concepts formels) dont la signification est explicite. Il existe une relation d’ordre partiel entre les concepts formels résultant de l’ACF, qui sont organisés en une structure mathématique appelée treillis de Galois. Malgré ses nombreux avantages, l’ACF est peu accessible à des utilisateurs non experts de l’analyse de données. En effet, malgré les représentations graphiques des treillis de Galois, ceux-ci restent difficiles à interpréter, notamment lorsque les données sont volumineuses. De plus, la construction des données d’entrée de l’ACF sous la forme d’un contexte formel peut être délicate. Pour cela, nous avons proposé une méthodologie d’interprétation des treillis de Galois reposant sur un ensemble de métriques simples, dont les résultats sont présentés sous une forme visuelle aussi intuitive que possible. Nous avons également développé des stratégies pour construire des contextes formels qui, non seulement, dénaturent le moins possible les données initiales, mais permettent aussi de tenir compte des besoins de l’utilisateur en termes de recherche d’information.