Thèse soutenue

Découpage textuel dans la traduction assistée par les systèmes de mémoire de traduction

FR  |  
EN
Auteur / Autrice : Anna Popis
Direction : Amr Helmy IbrahimTeresa Tomaszkiewicz
Type : Thèse de doctorat
Discipline(s) : Linguistique
Date : Soutenance le 13/12/2013
Etablissement(s) : Paris 4 en cotutelle avec Uniwersytet imienia Adama Mickiewicza (Poznań, Pologne)
Ecole(s) doctorale(s) : École doctorale Concepts et langages (Paris)
Partenaire(s) de recherche : Equipe de recherche : Sens, texte, informatique, histoire (Paris)
Jury : Président / Présidente : Weronika Wilczynska
Examinateurs / Examinatrices : Amr Helmy Ibrahim, Teresa Tomaszkiewicz, Mieczysław Gajos, Patrice Pognan

Résumé

FR  |  
EN

L’objectif des études théoriques et expérimentales présentées dans ce travail était de cerner à l’aide des critères objectifs fiables un niveau optimum de découpage textuel pour la traduction spécialisée assistée par un système de mémoire de traduction (SMT) pour les langues française et polonaise. Afin de réaliser cet objectif, nous avons élaboré notre propre approche : une nouvelle combinaison des méthodes de recherche et des outils d’analyse proposés surtout dans les travaux de Simard (2003), Langlais et Simard (2001, 2003) et Dragsted (2004) visant l’amélioration de la viabilité des SMT à travers des modifications apportées à la segmentation phrastique considérée comme limitant cette viabilité. A la base des observations de quelques réalisations effectives du processus de découpage textuel dans la traduction spécialisée effectuée par l’homme sans aide informatique à la traduction, nous avons déterminé trois niveaux de segmentation potentiellement applicables dans les SMT tels que phrase, proposition, groupes verbal et nominal. Nous avons ensuite réalisé une analyse comparative des taux de réutilisabilité des MT du système WORDFAST et de l’utilité des traductions proposées par le système pour chacun de ces trois niveaux de découpage textuel sur un corpus de douze textes de spécialité. Cette analyse a permis de constater qu’il n’est pas possible de déterminer un seul niveau de segmentation textuelle dont l’application améliorerait la viabilité des SMT de façon incontestable. Deux niveaux de segmentation textuelle, notamment en phrases et en propositions, permettent en effet d’assurer une viabilité comparable des SMT.