Thèse soutenue

Méthode de décomposition rectangulaire d'une relation binaire : une base formelle et uniforme pour la génération automatique des thésaurus et la recherche documentaire

FR  |  
EN
Auteur / Autrice : Mohamed Mohsen Gammoudi
Direction : Ali JaouaNhan Le Thanh
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1993
Etablissement(s) : Nice
Jury : Président / Présidente : Serge Miranda
Examinateurs / Examinatrices : Claudine Peyrat
Rapporteur / Rapporteuse : Nadir Belkhiter, Marie-France Bruandet, Bernard Causse

Résumé

FR  |  
EN

La plupart des travaux relatifs aux bases de données documentaires (BDD) montrent que le thesaurus constitue un outil nécessaire et utile pour l'indexation et la recherche. Dans la majorité des BDD sa construction reste manuelle et très couteuse. De plus, les approches utilisées pour la conception des BDD sont soit complexes à mettre en œuvre (approche linguistique) soit utilisant des outils de calcul définis d'une manière ad-hoc sans base théorique suffisante (approche statistique). Pour pallier à ces problèmes, nous proposons une méthode de construction automatique de thesaurus (problème crucial) et de représentation intermédiaire d'une BDD. Notre méthode de construction est justifiée par une base théorique. En effet, dans la première partie de cette thèse, nous présentons la théorie sur laquelle nous nous appuyons pour donner une vision unifiée de l'indexation et la recherche dans une BDD. Ensuite, nous définissons des heuristiques pour donner une solution approche à deux problèmes NP-complets : extraction de rectangles optimaux d'une relation binaire R et la recherche d'une couverture minimale de R. Ces heuristiques sont évaluées de deux points de vue : temps d'exécution et espace de stockage. Dans la deuxième partie, nous appliquons cette méthode pour générer automatiquement le thesaurus rectangulaire à partir d'une matrice binaire (terme, terme) et pour définir une représentation intermédiaire du BDD à partir d'une matrice (terme, document) sous forme d'un graphe de rectangles (GR). Les connexions de Galois nous permettent de formuler ou de reformuler une requête documentaire, exprime sous forme d'un système d'inéquation. La résolution de ce système consiste à retrouver un ou plusieurs rectangles dans un GR