Constitution et exploitation de bi-textes pour l'Aide à la traduction
Auteur / Autrice : | Olivier Kraif |
Direction : | Henri Zinglé |
Type : | Thèse de doctorat |
Discipline(s) : | Linguistique |
Date : | Soutenance en 2001 |
Etablissement(s) : | Nice |
Mots clés
Mots clés contrôlés
Résumé
La présente étude est centrée sur les problèmes liés à la constitution des corpus bi-textuels et à leur exploitation pour l'aide à la traduction. D'abord, nous distinguons la traduction en tant qu'activité de communication du simple transcodage, impliquant le transfert des unités et des structures d'une langue vers une autre. Ainsi nous montrons que la traduction est une affaire d'interprétation. Nous examinons les problèmes découlant des divergences entre les organisations lexicales et grammaticales des deux langues, et montrons qu'il est difficile d'aboutir à des systèmes de transformation généraux dès lors qu'on intégre les phénomènes idiomatiques. Nous en tirons la notion d'unité de traduction, cristallisant différents types de phénomènes contrastifs. La deuxième partie est consacrée à l'alignement phrastique, visant à la constitution automatique de bi-textes. Nous développons les techniques les plus répandues et les mieux éprouvées, tant du point de vue des indices que des algorithmes. Par un travail empirique, nous montrons comment articuler ces techniques de façon optimale sur la base d'une heuristique simple. Enfin nous abordons les problèmes de l'alignement au niveau lexical. Nous montrons que le critère de compositionnalité traductionnelle au niveau des mots ne permet pas d'extraire des couples cohérents, tant du point de vue de la segmentation qu'au niveau de l'équivalence des segments appariés. Nous introduisons le concept de correspondance lexicale, désignant l'appariement d'unités prédéfinies au niveau contrastif, et dont le transfert est considéré comme facultatif. Nous montrons empiriquement comment ces correspondances peuvent être extraites à partir d'indices adaptés et d'algorithmes simples. Les bi-textes apparaissent comme des gisements d'informations contrastives, dont les outils d'observation statistique permettent d'extraire les régularités, les équivalences générales émergeant à travers la masse des traductions particulières.