Reconnaissance des structures de documents
Auteur / Autrice : | Yihong Gong |
Direction : | Bernard Dubuisson |
Type : | Thèse de doctorat |
Discipline(s) : | Contrôle des systèmes |
Date : | Soutenance en 1994 |
Etablissement(s) : | Compiègne |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Compiègne) |
Résumé
La reconnaissance des structures de documents est indispensable pour intégrer les documents sur support papier dans un système de gestion documentaire. Dans cette thèse, nous présentons notre travail qui couvre la chaîne entière de reconnaissance des structures textuelles d'un document scientifique : des images binaires du document jusqu'a la structure logique hiérarchique du document, en passant par la reconnaissance de la structure physique du document. La reconnaissance des structures spécifiques d'un document est basée sur les structures génériques correspondantes. L'identification des objets physiques et logiques ainsi que l'étiquetage logique des portions de contenu du document sont réalisés en utilisant des règles de reconnaissance. Les représentations des structures internes du document s'inspirent de la norme ODA.