Thèse soutenue

Gestion de documents multimédia et recherche d'informations dans un système collaboratif

FR  |  
EN
Auteur / Autrice : Larbi Guezouli
Direction : Bernard Goossens
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2007
Etablissement(s) : Paris 7

Mots clés

FR

Résumé

FR  |  
EN

La recherche et la gestion de documents multimédia s'appuient sur un système de recherche d'informations capable de trouver dans une grande base un ensemble de données répondant aux contraintes d'une requête. Notre thèse porte plus spécifiquement sur les documents textuels et vidéos. Concernant les documents textuels, l'association d'une approche linguistique (normalisation et lemmatisation) à une approche statistique simplifie la recherche. L'approche statistique fait une recherche rapide dans le corpus pour filtrer les documents afin de ne traiter que ceux qui semblent pertinents. L'approche linguistique appliquée aux documents restants se base sur les origines des unités linguistiques porteuses de sens. La recherche de documents vidéo nécessite un pré-traitement de chaque document. La segmentation de la vidéo permet d'identifier les trames représentatives du document. La recherche proprement dite s'effectue au sein des documents prétraités pour gagner en efficacité. Une fois les documents textuels et vidéos sélectionnés et préparés, il ne reste plus qu'à calculer le taux de similarité de chacun avec le document formant la requête. Ce calcul se base sur les positions des unités linguistiques et des trames, sur leurs voisinages et leurs fréquences et sur la taille des documents. Le modèle proposé dans la thèse fait apparaître que la combinaison de ces approches donne un système de recherche d'informations multimédia performant, robuste, précis et rapide.