Contribution à la restauration des images de documents anciens
Auteur / Autrice : | Fadoua Drira |
Direction : | Hubert Emptoz, Frank Lebourgeois |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2007 |
Etablissement(s) : | Lyon, INSA |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'InfoRmatique en Images et Systèmes d'information (Ecully, Rhône ; 2003-....) |
Résumé
La numérisation massive de documents patrimoniaux ouvre de nouvelles perspectives de Recherche comme la restauration des documents dégradés. Ces dégradations sont dues au mauvais état de conservation et à la numérisation. De telles altérations sur des images aussi complexes ne peuvent pas être traitées par une simple transposition des outils traditionnels de restauration. Cette thèse traite donc de la restauration des dégradations des images des documents anciens, et plus particulièrement des dégradations du support papier et des formes des lettres car elles nuisent à la lisibilité des documents numérisés et empêchent tout traitement automatisé. Pour les dégradations du support papier, assimilées à un problème de superposition de couches, nous proposons deux méthodes. La première est une méthode de segmentation récursive issue de l’algorithme des nuées dynamiques appliquée sur les données décorrélées par l’analyse en composantes principales. La deuxième méthode est une amélioration de l’algorithme du Mean-Shift qui réduit sa complexité de calcul. Nous proposons, ensuite, de traiter les dégradations des formes des lettres par des méthodes de diffusion. Tout d’abord, nous présentons les modèles existants les plus adaptés à la restauration des images de document. Ensuite, nous proposons un modèle de diffusion capable de filtrer les contours et de renforcer la continuité des traits tout en préservant les singularités. Pour concevoir une approche capable de restaurer à la fois les dégradations du support papier et des formes des lettres, nous proposons une combinaison entre la segmentation et la diffusion. Cette combinaison permet de réaliser une segmentation en couches des images de documents tout en préservant la forme des contours des lettres.