Thèse soutenue

Analyse linguistique et formalisation pour le traitement automatique de la paraphrase

FR  |  
EN
Auteur / Autrice : Wannachai Kampeera
Direction : Sylviane Cardey-Greenfield
Type : Thèse de doctorat
Discipline(s) : Sciences du langage. Traitement automatique des langues
Date : Soutenance le 29/04/2013
Etablissement(s) : Besançon
Ecole(s) doctorale(s) : Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon ; 1991-2016)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière (Besançon) - Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière
Jury : Président / Présidente : Bohdan Krzysztof Bogacki
Examinateurs / Examinatrices : Sylviane Cardey-Greenfield, Bohdan Krzysztof Bogacki, Christian Fluhr, Farouk Bouhadiba, Peter Greenfield, Laurent Spaggiari
Rapporteurs / Rapporteuses : Bohdan Krzysztof Bogacki, Christian Fluhr

Résumé

FR  |  
EN

Les relations paraphrastiques entre plusieurs ensembles de paraphrasespeuvent se décrire en termes de suites de transformations textuelles. Pour qu’il aitparaphrase, il faut qu’une substitution lexicale noyau se mette en route entrainantd’autres modifications syntaxiques, lexicales et morphologiques.Après avoir décrit les mécanismes de paraphrasage récurrents, nous avons proposédeux formalisations. La première est théorique et explique les différentes relationsparaphrastiques entretenues par les paraphrases entre-elles. La deuxième,tournée vers des applications, formalise les structures paraphrastiques sous-formede prédicats-arguments. Nous considérons cette dernière adaptée au traitementautomatique de la paraphrase.Nous avons à la suite implémenté un système d’extraction de structures paraphrastiques.Il s’agit d’un système opérationnel appliqué à un volume de donnéesrelevant de notre domaine d’étude, et dont le but est de donner un exemple concretd’emploi possible de notre formalisation.Mots-clés : paraphrase, structures paraphrastiques, traitement automatique dela paraphrase, extraction des structures paraphrastiques