Vision monoculaire : contributions théoriques et application à la numérisation des documents
Auteur / Autrice : | Frédéric Courteille |
Direction : | Jean-Denis Durou |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2006 |
Etablissement(s) : | Toulouse 3 |
Résumé
Un des problèmes classiques en vision par ordinateur est la reconstruction tridimensionnelle d'une scène à partir d'une seule image. Dans cette thèse, nous nous intéressons à ce problème par le biais de deux méthodes de reconstruction, à savoir le shape from shading et le shape from contour qui utilisent, respectivement, l'information photométrique et une partie de l'information géométrique contenues dans l'image. Dans un premier temps, nous remettons en question certaines des hypothèses nécessaires à ces deux méthodes, afin d'en obtenir des modélisations réalistes. Ceci nous permet, dans un deuxième temps, de généraliser les méthodes de résolution existantes et d'en proposer de nouvelles. Ces contributions théoriques nous amènent à nous intéresser, en guise d'application, à la numérisation des documents. Si le procédé classique, qui utilise un scanner à plat, est satisfaisant pour les situations courantes, il présente deux faiblesses: d'une part, lorsqu'il s'agit d'un livre, la manipulation répétitive consistant à tourner une page puis à plaquer le livre contre la vitre du scanner est relativement fastidieuse; d'autre part, l'image numérisée comporte des défauts (caractères flous ou déformés, effets de parallaxe, papier non encré de couleur non uniforme) si le document est «bombé», comme c'est le cas pour un livre épais. Pour pallier ces deux faiblesses, nous proposons de remplacer le scanner par un appareil photographique numérique, puis de corriger les défauts de la photographie en utilisant l'information tridimensionnelle de la scène. Nous obtenons des résultats très satisfaisants sur images réelles.