Approches quantitatives de l'extraction de ressources traductionnelles à partir de corpus parallèles
| Auteur / Autrice : | Maria Zimina |
| Direction : | André Salem |
| Type : | Thèse de doctorat |
| Discipline(s) : | Sciences du langage |
| Date : | Soutenance en 2004 |
| Etablissement(s) : | Paris 3 |
Mots clés
Mots clés contrôlés
Résumé
Ce travail présente les résultats d’une série de recherches consacrées au développement d’une nouvelle famille d’outils d’exploration textométrique intertextuelle. De nombreuses méthodes de statistique textuelle ont été articulées et adaptées au cadre multilingue : la méthode des segments répétés, les spécificités, la topographie bi-textuelle, les cooccurrences multiples, l’analyse factorielle des correspondances, la classification automatique, etc. L’utilisation de chaque méthode dans le contexte multilingue est illustrée par des exemples d’applications concrètes, accompagnés d’échantillons de ressources traductionnelles obtenues à partir du corpus parallèle français/anglais de la Convention de sauvegarde de Droits de l’Homme. Les perspectives ouvertes par cette approche offrent aux traducteurs, enseignants des langues étrangères, terminologues, lexicographes, etc. Des moyens automatisés pour explorer la structure des équivalences lexicales dans les corpus de traduction.