Perception de scènes : traitement fréquentiel du signal visuel : aspects psychophysiques et neurophysiologiques
Auteur / Autrice : | Aude Oliva |
Direction : | Jeanny Hérault |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences cognitives |
Date : | Soutenance en 1995 |
Etablissement(s) : | Grenoble INPG |
Résumé
Dans le domaine de la reconnaissance de formes, l'identification des scenes est souvent consideree comme l'etape finale d'une reconstruction progressive du stimulus a partir d'attributs locaux tels que les contours des objets. Cependant, notre systeme visuel filtre l'image a differentes resolutions spatiales, qui procurent chacune des informations permettant d'identifier l'image. Dans la premiere partie de notre travail, nous etudions les strategies utilisees par le systeme visuel humain afin de reconnaitre une scene. Dans une seconde partie, nous proposons une voie de recherche possible afin de classer les scenes. Afin de tester les performances humaines, nous proposons une nouvelle methode experimentale, les images hybrides, qui dissocie les frequences spatiales hautes et basses d'une image. Les resultats des experiences montrent que toutes les echelles spatiales sont percues au tout debut du traitement visuel (30 ms). Les interactions entre les contraintes de haut-niveau (types de taches, poids des ressources attentionnelles) et les attributs rendus disponibles par le systeme perceptif, suggerent un encodage flexible de l'echelle spatiale la plus pertinente pour realiser une tache. Plus precisement, une tache de reconnaissance rapide utilise preferentiellement les basses frequences spatiales avant les hautes pour categoriser une scene. Cette analyse coarse-to-fine est observee sur un modele de retine artificielle. D'autres experiences montrent que la pertinence d'une information a une certaine resolution spatiale determine quelle resolution sera utilisee par le systeme. Quelle que soit la resolution spatiale selectionnee, la premiere analyse d'un systeme de vision est de savoir dans quel environnement il se trouve. Nous proposons dans une seconde partie, une strategie de recherche afin de coder les informations pertinentes des scenes. En utilisant les fonctions de gabor et un reseau auto-organisant, nous observons que les categories de scenes peuvent etre differenciees les unes des autres sur la base de quelques attributs disponibles a basse resolution