Vers un plus grand lien entre alignement, segmentation et structure des phrases
| Auteur / Autrice : | Fabien Cromières |
| Direction : | Christian Boitet, Yves Lepage |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance en 2010 |
| Etablissement(s) : | Grenoble |
| Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble, Isère, France ; 1995-....) |
Mots clés
Mots clés libres
Résumé
Le travail présenté dans cette thèse se place dans le contexte de l'alignement sous-phrastique. Une des ses originalités du point de vue adopté est de ne pas considérer l'alignement de façon isolé, mais dans sa relation avec la segmentation et la structure des phrases. Dans une première partie, nous nous intéressons à la technique classique d'alignement par corrélation, à laquelle nous apportons quelques modestes contributions. Nous étudions ensuite comment cette technique simple peut aboutir à la construction d'alignement hiérarchiques mêlant des informations sur la structure des phrases et sur leur alignement. Nous discutons aussi de la possibilité d'utiliser ces alignements hiérarchiques pour la traduction automatique. Dans une deuxième partie, nous étudions les liens entre segmentation et alignement. Nous discutons des différents critères de segmentation et des avantages à effectuer simultanément segmentation et alignement. Nous proposons à cet effet plusieurs algorithmes de complexité croissante : d'abord en étendant le concept d'alignement par corrélation, et ensuite, en élaborant un modèle probabiliste d'alignement plus complexe, avec notamment un usage original de l'algorithme de propagation de croyance. Dans une troisième partie, nous nous intéressons aux relations entre structure monolingue des phrases et alignement. Nous essayons d'abord d'analyser dans quelle mesure la structure des phrases peut se refléter dans l'alignement, et quelle notion de structure est la plus pertinente pour cette question. Nous utilisons ensuite cette analyse pour développer des algorithmes d'alignement prenant en compte cette structure.