Thèse soutenue

Approche hybride pour le résumé automatique de textes : Application à la langue arabe

FR
Auteur / Autrice : Mohamed Maaloul
Direction : Philippe BlacheLamia Hadrich Belguith
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 18/12/2012
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....)
Jury : Président / Présidente : Alexis Nasr
Examinateurs / Examinatrices : Philippe Blache, Alexis Nasr, Rim Faiz, Juan-Manuel Torres-Moreno
Rapporteurs / Rapporteuses : Rim Faiz, Juan-Manuel Torres-Moreno

Résumé

FR  |  
EN

Cette thèse s'intègre dans le cadre du traitement automatique du langage naturel. La problématique du résumé automatique de documents arabes qui a été abordée, dans cette thèse, s'est cristallisée autour de deux points. Le premier point concerne les critères utilisés pour décider du contenu essentiel à extraire. Le deuxième point se focalise sur les moyens qui permettent d'exprimer le contenu essentiel extrait sous la forme d'un texte ciblant les besoins potentiels d'un utilisateur. Afin de montrer la faisabilité de notre approche, nous avons développé le système "L.A.E", basé sur une approche hybride qui combine une analyse symbolique avec un traitement numérique. Les résultats d'évaluation de ce système sont encourageants et prouvent la performance de l'approche hybride proposée. Ces résultats, ont montré, en premier lieu, l'applicabilité de l'approche dans le contexte de documents sans restriction quant à leur thème (Éducation, Sport, Science, Politique, Reportage, etc.), leur contenu et leur volume. Ils ont aussi montré l'importance de l'apprentissage dans la phase de classement et sélection des phrases forment l'extrait final.