Thèse soutenue

Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Zacharie Ales
Direction : Laurent VercouterChristian Gout
Type : Thèse de doctorat
Discipline(s) : Mathématiques/Informatique
Date : Soutenance le 28/11/2014
Etablissement(s) : Rouen, INSA
Ecole(s) doctorale(s) : École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime ; ....-2016)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique- de Traitement de l'Information et des Systèmes / LITIS - Laboratoire Mathématique de l'INSA / LMI
Jury : Président / Présidente : Colin de La Higuera
Examinateurs / Examinatrices : Laurent Vercouter, Christian Gout, Colin de La Higuera, Martine Labbé, Ali Ridha Mahjoub, Olivier Pietquin, Arnaud Knippel, Alexandre Pauchet
Rapporteurs / Rapporteuses : Martine Labbé, Ali Ridha Mahjoub, Olivier Pietquin

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans le cadre de l’aide à l’analyse de dialogues, un corpus de dialogues peut être représenté par un ensemble de tableaux d’annotations encodant les différents énoncés des dialogues. Afin d’identifier des schémas dialogiques mis en oeuvre fréquemment, nous définissons une méthodologie en deux étapes : extraction de motifs récurrents, puis partitionnement de ces motifs en classes homogènes constituant ces régularités. Deux méthodes sont développées afin de réaliser l’extraction de motifs récurrents : LPCADC et SABRE. La première est une adaptation d’un algorithme de programmation dynamique tandis que la seconde est issue d’une modélisation formelle du problème d’extraction d’alignements locaux dans un couple de tableaux d’annotations.Le partitionnement de motifs récurrents est réalisé par diverses heuristiques de la littérature ainsi que deux formulations originales du problème de K-partitionnement sous la forme de programmes linéaires en nombres entiers. Lors d’une étude polyèdrale, nous caractérisons des facettes d’un polyèdre associé à ces formulations (notamment les inégalités de 2-partitions, les inégalités 2-chorded cycles et les inégalités de clique généralisées). Ces résultats théoriques permettent la mise en place d’un algorithme de plans coupants résolvant efficacement le problème.Nous développons le logiciel d’aide à la décision VIESA, mettant en oeuvre ces différentes méthodes et permettant leur évaluation au cours de deux expérimentations réalisées par un expert psychologue. Des régularités correspondant à des stratégies dialogiques que des extractions manuelles n’avaient pas permis d’obtenir sont ainsi identifiées.