Thèse soutenue

Alignement textuel monolingue avec recherche de déplacements : algorithmique pour la critique génétique

FR  |  
EN
Auteur / Autrice : Julien Bourdaillet
Direction : Jean-Gabriel Ganascia
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2007
Etablissement(s) : Paris 6

Résumé

FR

Ce travail de thèse répond à une problématique suscitée par la critique génétique textuelle (étude des brouillons d'écrivains) d'alignement textuel monolingue avec recherche de déplacements. D'un point de vue informatique, c’est un problème NP-difficile de type distance d'édition avec déplacement. Or notre objectif était un algorithme efficace passant à l'échelle, ce qui permet la recherche des déplacements dans des livres. Nous proposons une formalisation en un problème d'optimisation combinatoire multiobjectif intégrant un objectif syntaxique. Un algorithme d'alignement de séquences basé sur l'alignement par fragments est proposé. Notre algorithme est basé sur la coordination de la résolution des recouvrements entre occurrences d'une répétition. Il résout le problème avec une complexité efficace et passe à l'échelle. De plus, il présente de meilleurs résultats que les méthodes existantes et est maintenant utilisé par les généticiens du texte afin d'étudier les brouillons d'écrivains.