La traduction automatique statistique factorisée : une application à la paire de langues français - roumain
Auteur / Autrice : | Elena-Mirabela Laporte |
Direction : | Thierry Grass, Amalia Todiraşcu-Courtier |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 13/06/2014 |
Etablissement(s) : | Strasbourg |
Ecole(s) doctorale(s) : | École doctorale des Humanités (Strasbourg ; 2009-....) |
Partenaire(s) de recherche : | Laboratoire : Linguistique, langues, parole (Strasbourg) |
Jury : | Président / Présidente : Francis Grossmann |
Rapporteurs / Rapporteuses : Ulrich Heid, Dan Tufiş |
Mots clés
Mots clés contrôlés
Résumé
Un premier objectif de cette thèse est la constitution de ressources linguistiques pour un système de traduction automatique statistique factorisée français - roumain. Un deuxième objectif est l’étude de l’impact des informations linguistiques exploitées dans le processus d’alignement lexical et de traduction. Cette étude est motivée, d’une part, par le manque de systèmes de traduction automatique pour la paire de langues étudiées et, d’autre part, par le nombre important d’erreurs générées par les systèmes de traduction automatique actuels. Les ressources linguistiques requises par ce système sont des corpus parallèles alignés au niveau propositionnel et lexical. Ces corpus sont également segmentés lexicalement, lemmatisés et étiquetés au niveau morphosyntaxique.