Recherche top-k pour le contenu du Web

Raphaël Bonaque

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Recherche top-k pour le contenu du Web

FR |

EN

Auteur / Autrice :	Raphaël Bonaque
Direction :	Ioana Gabriela Manolescu Goujot
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 30/09/2016
Etablissement(s) :	Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche :	établissement opérateur d'inscription : Université Paris-Sud (1970-2019)
	Laboratoire : Laboratoire de recherche en informatique (Orsay, Essonne ; 1998-2020) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Saclay, Ile-de-France) - Laboratoire d'informatique de l'École polytechnique (Palaiseau ; 1988-....)
Jury :	Président / Présidente : Dario Colazzo
	Examinateurs / Examinatrices : Ioana Gabriela Manolescu Goujot, Dario Colazzo, Bernd Amann, Katja Hose, Bogdan Cautis, François Goasdoué, Sarah Cohen-Boulakia, Cédric Du Mouza
	Rapporteurs / Rapporteuses : Bernd Amann, Katja Hose

Mots clés

FR |

EN

Mots clés contrôlés

Recherche de l'information

Réseaux sociaux (Internet)

Web sémantique

Mots clés libres

Résumé

FR |

EN

Les réseaux sociaux sont de plus en plus présents dans notre vie de tous les jours et sont en passe de devenir notre moyen de communication et d'information principal. Avec l'augmentation des données qu'ils contiennent sur nous et notre environnement, il devient décisif d'être en mesure d'accéder et d'analyser ces données. Aujourd'hui la manière la plus commune d'accéder à ces données est d'utiliser la recherche par mots-clés : on tape une requête de quelques mots et le réseau social renvoie un nombre fixe de documents qu'il juge pertinents. Dans les approches actuelles de recherche top-k dans un contexte social, la pertinence d'un document dépend de deux facteurs: la proximité sociale entre le document et l'utilisateur faisant la requête et le recoupement entre les mots-clés de la requête et les mots contenus dans le document. Nous trouvons cela limité et proposons de prendre en compte les interactions complexes entres les utilisateurs liés à ce document mais aussi sa structure et le sens des mots qu'il contient, au lieu de leur formulation. Dans ce but, nous identifions les exigences propres à la création d'un modèle qui intégrerait pleinement des données sémantiques, structurées et sociales et proposons un nouveau modèle, S3, satisfaisant ces exigences. Nous rajoutons un modèle de requêtes à S3 et développons S3k, un algorithme personnalisable de recherche top-k par mots-clés sur S3. Nous prouvons la correction de notre algorithme et en proposons une implémentation. Nous la comparons, à l'aide de jeux de données créés à partir du monde réel, avec celle d'une autre approche de recherche top-k par mots-clés dans un contexte social et montrons les différences fondamentales entre ces approches ainsi que les avantages qu'on peut tirer de la nôtre.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Recherche top-k pour le contenu du Web

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Recherche top-k pour le contenu du Web

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses