Thèse soutenue

Traduction automatique statistique et adaptation à un domaine spécialisé

FR  |  
EN
Auteur / Autrice : Raphaël Rubino
Direction : Georges LinarèsFabrice LefèvrePhilippe Langlais
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 30/11/2011
Etablissement(s) : Avignon
Ecole(s) doctorale(s) : École doctorale Sciences et agrosciences (Avignon)
Partenaire(s) de recherche : Laboratoire : Laboratoire Informatique d'Avignon
Jury : Président / Présidente : Laurent Besacier
Examinateurs / Examinatrices : Jean Senellart
Rapporteurs / Rapporteuses : Kamel Smaïli, Hervé Blanchon

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Nous avons observé depuis plusieurs années l’émergence des approches statistiques pour la traduction automatique. Cependant, l’efficacité des modèles construits est soumise aux variabilités inhérentes au langage naturel. Des études ont montré la présence de vocabulaires spécifique et général composant les corpus de textes de domaines spécialisés. Cette particularité peut être prise en charge par des ressources terminologiques comme les lexiques bilingues.Toutefois, nous pensons que si le vocabulaire est différent entre des textes spécialisés ou génériques, le contenu sémantique et la structure syntaxique peuvent aussi varier. Dans nos travaux,nous considérons la tâche d’adaptation aux domaines spécialisés pour la traduction automatique statistique selon deux axes majeurs : l’acquisition de lexiques bilingues et l’édition a posteriori de traductions issues de systèmes automatiques. Nous évaluons l’efficacité des approches proposées dans un contexte spécialisé : le domaine médical. Nos résultats sont comparés aux travaux précédents concernant cette tâche. De manière générale, la qualité des traductions issues de systèmes automatiques pour le domaine médical est améliorée par nos propositions. Des évaluations en oracle tendent à montrer qu’il existe une marge de progression importante