Thèse soutenue

Cadre général pour la recherche d'information et l'extraction de connaissances par l'exploration de treillis

FR  |  
EN
Auteur / Autrice : Jean-François Viaud
Direction : Karell Bertet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 31/08/2017
Etablissement(s) : La Rochelle
Ecole(s) doctorale(s) : École doctorale Sciences et ingénierie pour l'information, mathématiques (Limoges ; 2009-2018)
Partenaire(s) de recherche : Laboratoire : Laboratoire Informatique, Image, Interaction (La Rochelle)
Jury : Président / Présidente : Amedeo Napoli
Examinateurs / Examinatrices : Karell Bertet, Amedeo Napoli, Sergei O. Kuznetsov, Lhouari Nourine, Nathalie Caspard, Jean-Loup Guillaume, Léonard Kwuida
Rapporteurs / Rapporteuses : Sergei O. Kuznetsov, Lhouari Nourine

Résumé

FR  |  
EN

Au cours des deux dernières décennies, nous avons été littéralement submergés par les données. Nous recevons, rapidement, un flux colossal de données hétérogènes. Les techniques issues de la recherche d’information doivent évoluer afin de les ordonner et de les sélectionner. D’un autre côté, les techniques d’extraction de connaissances sont capables d’extraire une quantité (exponentielle) de connaissances des données, en particulier lors de la fouille de règles d’association. De nouveaux outils doivent être fournis aux analystes des données. La recherche d’information et l’extraction de connaissances abordent la même problématique : elles structurent et organisent les données. La première sélectionne et attribue un rang, l’autre partitionne et hiérarchise. L’Analyse des Concepts Formels (FCA), introduite par R. Wille, utilise les treillis de concepts afin de mettre en évidence à la fois un ordre (au sens d’attribuer un rang) et une classification (au sens de partition). Cependant, il est bien connu de la communauté FCA que ces treillis peuvent avoir une taille exponentielle. Pour toutes ces raisons, des outils pour réduire la taille des données ou des treillis, sont nécessaires. Dans cette thèse, nous avons utilisé différentes approches. Des algorithmes distribués pour la FCA ont été définis afin de réduire la taille des données d’entrée en petits morceaux. Différentes méthodes de décomposition de treillis ont été étudiées ou définies. Certaines sont basées sur les relations de congruence, d’autres sur les relations de tolérance. Pour aider l’utilisateur dans ses choix de réduction, un cadre général, nommé LattExp, a été mis en place. LattExp fournit une possibilité de navigation à travers les réductions/décompositions et aide l’utilisateur dans ses choix.