Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of  Scientific Digital Libraries | Theses.fr

Hussein Al-Natsheh

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Approches en fouille de texte pour une exploration par similarité sémantique et un enrichissement en métadonnées des bibliothèques numériques

FR |

EN

Auteur / Autrice :	Hussein Al-Natsheh
Direction :	Djamel Abdelkader Zighed, Fabrice Muhlenbach
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 15/02/2019
Etablissement(s) :	Lyon
Ecole(s) doctorale(s) :	École doctorale en Informatique et Mathématiques de Lyon
Partenaire(s) de recherche :	Equipe de recherche : Entrepôts, Représentation et Ingénierie des Connaissances
	établissement opérateur d'inscriptions : Université Lumière (Lyon ; 1969-....)
	Laboratoire : Entrepôts- Représentation et Ingénierie des Connaissances / ERIC
Jury :	Président / Présidente : Nathalie Aussenac-Gilles
	Examinateurs / Examinatrices : Younès Bennani, Sabine Loudcher Rabaseda
	Rapporteurs / Rapporteuses : Juliette Dibie-Barthélemy, Gilles Venturini

Mots clés

FR |

EN

Mots clés contrôlés

Bibliothèques numériques

Mots clés libres

Recherche d’information

Similarité sémantique

Enrichissement de métadonnées

Fouille de texte

Désambiguïsation d’entités nommées

Bibliothèque numérique

Gestion de la connaissance

Résumé

FR |

EN

Pour les scientifiques et chercheurs, s’assurer que la connaissance est accessible pour pouvoir être réutilisée et développée est un point crucial. De plus, la façon dont nous stockons et gérons les articles scientifiques et leurs métadonnées dans les bibliothèques numériques détermine la quantité d’articles pertinents que nous pouvons découvrir et auxquels nous pouvons accéder en fonction de la signification réelle d’une requête de recherche. Cependant, sommes-nous en mesure d’explorer tous les documents scientifiques sémantiquement pertinents avec les systèmes existants de recherche d’information au moyen de mots-clés ? Il s’agit là de la question essentielle abordée dans cette thèse. L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine interdisciplinaire lorsqu’ils utilisent les systèmes de recherche d’information des bibliothèques numériques multidisciplinaires. Le problème se pose cependant lorsque de tels chercheurs utilisent des mots-clés de recherche dépendant de la communauté dont ils sont issus alors que d’autres termes scientifiques sont attribués à des concepts pertinents lorsqu’ils sont utilisés dans des communautés de recherche différentes. Afin de proposer une solution à cette tâche d’exploration sémantique dans des bibliothèques numériques multidisciplinaires, nous avons appliqué plusieurs approches de fouille de texte. Tout d’abord, nous avons étudié la représentation sémantique des mots, des phrases, des paragraphes et des documents pour une meilleure estimation de la similarité sémantique. Ensuite, nous avons utilisé les informations sémantiques des mots dans des bases de données lexicales et des graphes de connaissance afin d’améliorer notre approche sémantique. En outre, la thèse présente quelques implémentations de cas d’utilisation du modèle que nous avons proposé

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Approches en fouille de texte pour une exploration par similarité sémantique et un enrichissement en métadonnées des bibliothèques numériques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Approches en fouille de texte pour une exploration par similarité sémantique et un enrichissement en métadonnées des bibliothèques numériques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses