Méthodes par abstraction et extraction pour le résumé de conversations orales issues de centres d’appels téléphoniques
| Auteur / Autrice : | Jérémy Trione |
| Direction : | Frédéric Béchet, Benoît Favre |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance le 05/10/2017 |
| Etablissement(s) : | Aix-Marseille |
| Ecole(s) doctorale(s) : | École Doctorale Mathématiques et Informatique de Marseille (Marseille) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique fondamentale (Marseille) - Traitement Automatique du Langage Ecrit et Parlé (Marseille) |
| Jury : | Président / Présidente : Georges Linarès |
| Examinateurs / Examinatrices : Géraldine Damnati | |
| Rapporteurs / Rapporteuses : Emmanuel Morin, Sophie Rosset |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Le résumé automatique de document repose généralement sur des méthodes par extraction qui sélectionnent dans le texte des passages pertinents et les juxtaposent pour former un résumé. Ces méthodes sont peu adaptées à la problématique du résumé de conversations orales de part la nature spontanée de celles-ci et l’importance de l’interaction entre les locuteurs. En ne sélectionnant que certains passages, les résumés par extraction ne contiennent qu’un verbatim de ce qui a été dit, et non pas une description synthétique de ce qui s’est passé lors de la conversation. C'est pourquoi des approche abstractives basées sur la détection de concepts permettrait de palier ces difficultés.Dans un premier temps nous testons et analysons des méthodes de résumés par extraction appliquées à des données orales. Puis nous étudions l'intérêt de l'utilisation de modèles sémantiques dans la tâche de résumé automatique. Enfin nous proposons une méthode de résumé à base de patrons.Les méthodes de résumé par remplissage de patrons ont montré leur intérêt dans des domaines spécifiques pour le résumé automatique de texte. Dans notre cas, elles permettent de traiter du problème de différence de genre entre les données source (transcriptions de conversations) et la forme des résumés à générer (narration synthétique). Toutefois, elles nécessitent l’écriture manuelle de patrons de résumés et l’annotation manuelle de quantités de données source en concepts à détecter pour remplir ces patrons.