Méthode de décomposition rectangulaire d'une relation binaire : une base formelle et uniforme pour la génération automatique des thésaurus et la recherche documentaire
Auteur / Autrice : | Mohamed Mohsen Gammoudi |
Direction : | Ali Jaoua, Nhan Le Thanh |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1993 |
Etablissement(s) : | Nice |
Jury : | Président / Présidente : Serge Miranda |
Examinateurs / Examinatrices : Claudine Peyrat | |
Rapporteur / Rapporteuse : Nadir Belkhiter, Marie-France Bruandet, Bernard Causse |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La plupart des travaux relatifs aux bases de données documentaires (BDD) montrent que le thesaurus constitue un outil nécessaire et utile pour l'indexation et la recherche. Dans la majorité des BDD sa construction reste manuelle et très couteuse. De plus, les approches utilisées pour la conception des BDD sont soit complexes à mettre en œuvre (approche linguistique) soit utilisant des outils de calcul définis d'une manière ad-hoc sans base théorique suffisante (approche statistique). Pour pallier à ces problèmes, nous proposons une méthode de construction automatique de thesaurus (problème crucial) et de représentation intermédiaire d'une BDD. Notre méthode de construction est justifiée par une base théorique. En effet, dans la première partie de cette thèse, nous présentons la théorie sur laquelle nous nous appuyons pour donner une vision unifiée de l'indexation et la recherche dans une BDD. Ensuite, nous définissons des heuristiques pour donner une solution approche à deux problèmes NP-complets : extraction de rectangles optimaux d'une relation binaire R et la recherche d'une couverture minimale de R. Ces heuristiques sont évaluées de deux points de vue : temps d'exécution et espace de stockage. Dans la deuxième partie, nous appliquons cette méthode pour générer automatiquement le thesaurus rectangulaire à partir d'une matrice binaire (terme, terme) et pour définir une représentation intermédiaire du BDD à partir d'une matrice (terme, document) sous forme d'un graphe de rectangles (GR). Les connexions de Galois nous permettent de formuler ou de reformuler une requête documentaire, exprime sous forme d'un système d'inéquation. La résolution de ce système consiste à retrouver un ou plusieurs rectangles dans un GR