Thèse soutenue

Méthodes par abstraction et extraction pour le résumé de conversations orales issues de centres d’appels téléphoniques

FR  |  
EN
Auteur / Autrice : Jérémy Trione
Direction : Frédéric BéchetBenoît Favre
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 05/10/2017
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École Doctorale Mathématiques et Informatique de Marseille (Marseille)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique fondamentale (Marseille) - Traitement Automatique du Langage Ecrit et Parlé (Marseille)
Jury : Président / Présidente : Georges Linarès
Examinateurs / Examinatrices : Géraldine Damnati
Rapporteurs / Rapporteuses : Emmanuel Morin, Sophie Rosset

Mots clés

FR  |  
EN

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Le résumé automatique de document repose généralement sur des méthodes par extraction qui sélectionnent dans le texte des passages pertinents et les juxtaposent pour former un résumé. Ces méthodes sont peu adaptées à la problématique du résumé de conversations orales de part la nature spontanée de celles-ci et l’importance de l’interaction entre les locuteurs. En ne sélectionnant que certains passages, les résumés par extraction ne contiennent qu’un verbatim de ce qui a été dit, et non pas une description synthétique de ce qui s’est passé lors de la conversation. C'est pourquoi des approche abstractives basées sur la détection de concepts permettrait de palier ces difficultés.Dans un premier temps nous testons et analysons des méthodes de résumés par extraction appliquées à des données orales. Puis nous étudions l'intérêt de l'utilisation de modèles sémantiques dans la tâche de résumé automatique. Enfin nous proposons une méthode de résumé à base de patrons.Les méthodes de résumé par remplissage de patrons ont montré leur intérêt dans des domaines spécifiques pour le résumé automatique de texte. Dans notre cas, elles permettent de traiter du problème de différence de genre entre les données source (transcriptions de conversations) et la forme des résumés à générer (narration synthétique). Toutefois, elles nécessitent l’écriture manuelle de patrons de résumés et l’annotation manuelle de quantités de données source en concepts à détecter pour remplir ces patrons.