Thèse soutenue

Reconnaissance automatique des actes de dialogue

FR  |  
CS  |  
EN
Auteur / Autrice : Pavel Král
Direction : Yves LaprieJana Klečková
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 12/11/2007
Etablissement(s) : Nancy 1 en cotutelle avec Západoceská univerzita v Plzni
Ecole(s) doctorale(s) : IAEM Lorraine
Partenaire(s) de recherche : Laboratoire : LORIA
Jury : Examinateurs / Examinatrices : Régine André-Obrecht, Ludek Müller, Jean-Paul Haton, Václav Matoušek, Jan Nouza, Christophe Cerisara, Yves Laprie, Jana Klecková
Rapporteurs / Rapporteuses : Régine André-Obrecht, Ludek Müller

Résumé

FR  |  
EN

Ce mémoire concerne la reconnaissance automatique des Actes de Dialogues (ADs) en tchéque et en français. Les ADs sont des unités au niveau de la phrase qui représentent des différents états d’un dialogue, comme par exemple les questions, les affirmations, les hésitations, etc. La première contribution de ce travail est de proposer et comparer plusieurs approches de reconnaissance des ADs qui sont basées sur trois types d’informations : lexical, prosodique et relative à la position des mots dans une phrase. Ces approches ont eté testées sur un corpus tchèque de dialogues homme-homme. Ce corpus a été transcris en mots manuellement, et avec un moteur de reconnaissance automatique afin de valider les approches dans des conditions réelles. Les résultats expérimentaux confirment que chaque type d’attributs apporte des informations pertinentes et complémentaires. Les méthodes proposées qui exploitent la position des mots sont particulièrement intéresantes, parce qu’elles utilisent une information globale sur la structure de la phrase. Une autre contribution conséquente, relative au manque de corpus étiquettés dans le domaine de la reconnaissance automatique des ADs, concerne le développement et l’étude de méthodes d’étiquetage semi-automatique de nouveaux corpus. Cette méthode est basée sur l’algorithme d’Espérance-Maximisation avec des ADs prédéfinis spécifiques à la tâche visée. Nous proposons deux mesures de confiance pour sélectionner les exemples qui ont le plus de chance d’être classifiés correctement. Les résultats expérimentaux démontrent que la méthode proposée est une approche intéressante pour la création de nouveaux corpus d’actes de dialogues à moindre coût.