On-demand Development of Statistical Machine Translation Systems | Theses.fr

Li Gong

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Développement à la demande des systèmes de traduction automatique statistiques

FR |

EN

Auteur / Autrice :	Li Gong
Direction :	François Yvon, Aurélien Max
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 25/11/2014
Etablissement(s) :	Paris 11
Ecole(s) doctorale(s) :	Ecole doctorale Informatique de Paris-Sud
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur (Orsay, Essonne ; 1972-2020)
Jury :	Président / Présidente : Christian Jacquemin
	Examinateurs / Examinatrices : François Yvon, Aurélien Max, Christian Jacquemin, Marc Dymetman, Andy Way, Béatrice Daille
	Rapporteurs / Rapporteuses : Marc Dymetman, Andy Way

Mots clés

FR |

EN

Mots clés contrôlés

Traduction assistée par ordinateur

Échantillonnage adaptatif (statistique)

Traduction automatique

Mots clés libres

Traduction automatique statistique

Alignement incrémental

Échantillonnage contextuel

Développement à la demande

Résumé

FR |

EN

La traduction automatique statistique produit des résultats qui en font un choix privilégié dans la plupart des scénarios de traduction assistée par ordinateur.Cependant, le développement de ces systèmes de haute performance implique des traitements très coûteux sur des données à grande échelle. De nouvelles données sont continuellement disponibles,alors que les systèmes construits de manière standard sont statiques, ce qui rend l'utilisation de nouvelles données couteuse car les systèmes sont typiquement reconstruits en intégralité.En outre, le processus d'adaptation des systèmes de traduction est généralement fondé sur un corpus de développement et est effectué une fois pour toutes. Dans cette thèse, nous proposons un cadre informatique pour répondre à ces trois problèmes conjointement. Ce cadre permet de développer des systèmes de traduction à la demande avec des mises à jour incrémentales et permet d’adapter les systèmes construits à chaque nouveau texte à traduire.La première contribution importante de cette thèse concerne une nouvelle méthode d'alignement sous-phrastique qui peut aligner des paires de phrases en isolation. Cette propriété permet aux systèmes de traduction de calculer des informations à la demande afin d'intégrer de façon transparente de nouvelles données disponibles sans re-entraînement complet des systèmes.La deuxième contribution importante de cette thèse est de proposer l'intégration de stratégies d'échantillonnage contextuel pour sélectionner des exemples de traduction à partir de corpus à grande échelle sur la base de leur similarité avec le texte à traduire afin d obtenir des tables de traduction adaptées

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Développement à la demande des systèmes de traduction automatique statistiques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Développement à la demande des systèmes de traduction automatique statistiques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses