Thèse soutenue

Sources de distorsion dans les résumés traduits de revues systématiques : Une comparaison de la traduction humaine et de la traduction automatique post-éditée

FR  |  
EN
Auteur / Autrice : Hanna Martikainen
Direction : Natalie Kübler
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 23/11/2019
Etablissement(s) : Université Paris Cité
Ecole(s) doctorale(s) : École doctorale Sciences du langage (Paris ; 2019-2025)
Partenaire(s) de recherche : Laboratoire : Approches Linguistiques Théoriques, Appliquées et Expérimentales : langues et cultures connectées (Paris ; 2005-....)
Jury : Président / Présidente : Christopher John Gledhill
Examinateurs / Examinatrices : François Maniez, Sharon O'Brien
Rapporteurs / Rapporteuses : Pascaline Dury, Rudy Loock

Résumé

FR  |  
EN

Ce travail porte sur l’impact potentiel de la traduction dans le domaine de spécialité médicale, plus spécifiquement les résumés de revues systématiques Cochrane. Nous nous intéressons à la distorsion que peut occasionner la traduction de ces textes spécialisés dans l’interprétation du lecteur et, ainsi, dans la transmission du savoir spécialisé. Dans le cadre de cette thèse, nous cherchons à savoir quels types d’éléments dans ces textes traduits sont susceptibles d’occasionner une telle distorsion, que nous définissons comme une interférence avec la visée communicative du texte spécialisé, et qui représente une déviation vis-à-vis d’une traduction fonctionnellement adéquate. Afin de décrire comment la distorsion se manifeste dans les textes traduits, nous caractérisons les moyens linguistiques mis en œuvre dans la réalisation de la visée communicative de ces textes spécialisés, qui passe notamment par les schémas lexico-grammaticaux étendus comportant souvent des marqueurs modaux. Sur la base d’analyses en corpus, nous catégorisons ces sources de distorsion potentielles dans une typologie opératoire. Celle-ci est ensuite appliquée à l’annotation d’échantillons de corpus de textes traduits, dans l’optique d’établir la fréquence et la distribution des sources de distorsion, notamment pour pouvoir comparer les différents processus utilisés dans la production de ces traductions : traduction humaine vs post-édition de traduction automatique statistique et neuronale. En dernier lieu, nous explorons la perception de la distorsion par les usagers.Nous observons que la distorsion dans l’interprétation peut être due aux erreurs de traduction portant sur des éléments essentiels du texte et notamment la terminologie, mais également à une traduction biaisée des structures lexico-grammaticales qui sont employées dans la réalisation de diverses fonctions dans ces textes spécialisés. La comparaison des modes de production permet de mettre en lumière les caractéristiques des textes issus des différents processus : tandis que la traduction humaine conventionnelle se caractérise par davantage de distorsions lexico-grammaticales, qui sont également de nature plus variée, ainsi que par une traduction plus affirmative en général, la traduction automatique statistique post-éditée se démarque par un plus grand nombre d’erreurs de traduction de tous types, de nature plus simple, mais également par une traduction plus fonctionnelle ou neutre des schémas lexico-grammaticaux. Ce dernier constat est toutefois à nuancer en fonction des résultats de l’analyse supplémentaire sur la traduction automatique neuronale, qui semble à plusieurs égards plus proche de la traduction humaine conventionnelle que de la traduction automatique statistique. Enfin, nos résultats suggèrent que la traduction biaisée de schémas LG est globalement perçue comme plus affirmative par les lecteurs potentiels de ces textes traduits. Nos travaux démontrent globalement l’importance de la gestion de syntagmes de longueurs diverses et de schémas lexico-grammaticaux étendus dans la traduction spécialisée, que celle-ci s’effectue par un processus de traduction humaine conventionnelle ou via la post-édition de traduction automatique