Thèse soutenue

Vers un plus grand lien entre alignement, segmentation et structure des phrases

FR  |  
EN
Auteur / Autrice : Fabien Cromières
Direction : Christian BoitetYves Lepage
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2010
Etablissement(s) : Grenoble
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble, Isère, France ; 1995-....)

Résumé

FR  |  
EN

Le travail présenté dans cette thèse se place dans le contexte de l'alignement sous-phrastique. Une des ses originalités du point de vue adopté est de ne pas considérer l'alignement de façon isolé, mais dans sa relation avec la segmentation et la structure des phrases. Dans une première partie, nous nous intéressons à la technique classique d'alignement par corrélation, à laquelle nous apportons quelques modestes contributions. Nous étudions ensuite comment cette technique simple peut aboutir à la construction d'alignement hiérarchiques mêlant des informations sur la structure des phrases et sur leur alignement. Nous discutons aussi de la possibilité d'utiliser ces alignements hiérarchiques pour la traduction automatique. Dans une deuxième partie, nous étudions les liens entre segmentation et alignement. Nous discutons des différents critères de segmentation et des avantages à effectuer simultanément segmentation et alignement. Nous proposons à cet effet plusieurs algorithmes de complexité croissante : d'abord en étendant le concept d'alignement par corrélation, et ensuite, en élaborant un modèle probabiliste d'alignement plus complexe, avec notamment un usage original de l'algorithme de propagation de croyance. Dans une troisième partie, nous nous intéressons aux relations entre structure monolingue des phrases et alignement. Nous essayons d'abord d'analyser dans quelle mesure la structure des phrases peut se refléter dans l'alignement, et quelle notion de structure est la plus pertinente pour cette question. Nous utilisons ensuite cette analyse pour développer des algorithmes d'alignement prenant en compte cette structure.