Analyse linguistique et formalisation pour le traitement automatique de la paraphrase
Auteur / Autrice : | Wannachai Kampeera |
Direction : | Sylviane Cardey-Greenfield |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage. Traitement automatique des langues |
Date : | Soutenance le 29/04/2013 |
Etablissement(s) : | Besançon |
Ecole(s) doctorale(s) : | Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon ; 1991-2016) |
Partenaire(s) de recherche : | Laboratoire : Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière (Besançon) - Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière |
Jury : | Président / Présidente : Bohdan Krzysztof Bogacki |
Examinateurs / Examinatrices : Sylviane Cardey-Greenfield, Bohdan Krzysztof Bogacki, Christian Fluhr, Farouk Bouhadiba, Peter Greenfield, Laurent Spaggiari | |
Rapporteurs / Rapporteuses : Bohdan Krzysztof Bogacki, Christian Fluhr |
Résumé
Les relations paraphrastiques entre plusieurs ensembles de paraphrasespeuvent se décrire en termes de suites de transformations textuelles. Pour qu’il aitparaphrase, il faut qu’une substitution lexicale noyau se mette en route entrainantd’autres modifications syntaxiques, lexicales et morphologiques.Après avoir décrit les mécanismes de paraphrasage récurrents, nous avons proposédeux formalisations. La première est théorique et explique les différentes relationsparaphrastiques entretenues par les paraphrases entre-elles. La deuxième,tournée vers des applications, formalise les structures paraphrastiques sous-formede prédicats-arguments. Nous considérons cette dernière adaptée au traitementautomatique de la paraphrase.Nous avons à la suite implémenté un système d’extraction de structures paraphrastiques.Il s’agit d’un système opérationnel appliqué à un volume de donnéesrelevant de notre domaine d’étude, et dont le but est de donner un exemple concretd’emploi possible de notre formalisation.Mots-clés : paraphrase, structures paraphrastiques, traitement automatique dela paraphrase, extraction des structures paraphrastiques