Thèse soutenue

La traduction automatique statistique factorisée : une application à la paire de langues français - roumain

FR  |  
EN
Auteur / Autrice : Elena-Mirabela Laporte
Direction : Thierry GrassAmalia Todiraşcu-Courtier
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 13/06/2014
Etablissement(s) : Strasbourg
Ecole(s) doctorale(s) : École doctorale des Humanités (Strasbourg ; 2009-....)
Partenaire(s) de recherche : Laboratoire : Linguistique, langues, parole (Strasbourg)
Jury : Président / Présidente : Francis Grossmann
Rapporteurs / Rapporteuses : Ulrich Heid, Dan Tufiş

Résumé

FR  |  
EN

Un premier objectif de cette thèse est la constitution de ressources linguistiques pour un système de traduction automatique statistique factorisée français - roumain. Un deuxième objectif est l’étude de l’impact des informations linguistiques exploitées dans le processus d’alignement lexical et de traduction. Cette étude est motivée, d’une part, par le manque de systèmes de traduction automatique pour la paire de langues étudiées et, d’autre part, par le nombre important d’erreurs générées par les systèmes de traduction automatique actuels. Les ressources linguistiques requises par ce système sont des corpus parallèles alignés au niveau propositionnel et lexical. Ces corpus sont également segmentés lexicalement, lemmatisés et étiquetés au niveau morphosyntaxique.