Thèse soutenue

Approches quantitatives de l'extraction de ressources traductionnelles à partir de corpus parallèles

FR  |  
EN
Auteur / Autrice : Maria Zimina
Direction : André Salem
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance en 2004
Etablissement(s) : Paris 3

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Ce travail présente les résultats d’une série de recherches consacrées au développement d’une nouvelle famille d’outils d’exploration textométrique intertextuelle. De nombreuses méthodes de statistique textuelle ont été articulées et adaptées au cadre multilingue : la méthode des segments répétés, les spécificités, la topographie bi-textuelle, les cooccurrences multiples, l’analyse factorielle des correspondances, la classification automatique, etc. L’utilisation de chaque méthode dans le contexte multilingue est illustrée par des exemples d’applications concrètes, accompagnés d’échantillons de ressources traductionnelles obtenues à partir du corpus parallèle français/anglais de la Convention de sauvegarde de Droits de l’Homme. Les perspectives ouvertes par cette approche offrent aux traducteurs, enseignants des langues étrangères, terminologues, lexicographes, etc. Des moyens automatisés pour explorer la structure des équivalences lexicales dans les corpus de traduction.