Thèse soutenue

Génération de réponses en langue naturelle orales et écrites pour les systèmes de question-réponse en domaine ouvert

FR  |  
EN
Auteur / Autrice : Anne Garcia-Fernandez
Direction : Anne VilnatSophie Rosset
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2010
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Les travaux présentés dans ce mémoire se situent dans le contexte de la réponse à une question. Contrairement à de nombreux travaux traitant de la recherche de l’information à fournir en réponse à une question, notre problématique principale a été de caractériser la forme que peut prendre une réponse en interaction avec une question qui puisse être produite par des systèmes de question-réponse. Nous exposons les enjeux de l’interaction du type “réponse à une question” considérant deux modalités d’interaction : l’oral et l’écrit. Nous montrons que répondre n’est pas uniquement présenter une information mais fait partie d’une interaction entre deux locuteurs. Cherchant à définir ce que pourrait être une réponse en interaction pour les systèmes de question-réponse, nous constatons l’absence de corpus constitué de telles réponses. Dans l’optique de constituer un tel corpus, la forme des questions utilisées lors de la collecte est primordiale. Une étude de l’état de l’art sur les variations linguistiques des questions est ainsi présentée. Nous exposons ensuite la constitution des questions ainsi que la collecte du corpus de réponses à l’oral et à l’écrit, et effectuée auprès de plus de 150 locuteurs natifs du français. Une évaluation du protocole utilisé est ensuite effectuée. Enfin, nous présentons une analyse du corpus collecté en répondant à un ensemble de questions préalables à création d’un module de génération de réponses en langue naturelle dans un système de question-réponse.