Thèse soutenue

De la rétine binoculaire aux premiers étages du cortex visuel pour la perception visuelle tridimensionnelle : modèle et expérimentations oculométriques
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Christophe Maggia
Direction : Anne Guérin-DuguéNathalie Guyader
Type : Thèse de doctorat
Discipline(s) : Sciences cognitives, psychologie cognitive, neurocognition
Date : Soutenance le 04/06/2014
Etablissement(s) : Grenoble
Ecole(s) doctorale(s) : École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Grenoble Images parole signal automatique
Jury : Président / Présidente : Patrick Le Callet
Examinateurs / Examinatrices : Alain Bellon, Alexandra Séverac Cauquil
Rapporteurs / Rapporteuses : Justin Plantier, Pascal Mamassian

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

La vision de la profondeur ou communément appelée « vision 3D » permet d'interpréter les relations spatiales tridimensionnelles entre les objets de la scène visuelle et confère à l'homme une grande précision dans ses interactions avec l'environnement. La vision 3D repose sur de nombreux mécanismes d'analyse du signal visuel dont la plupart gardent tout leur pouvoir informationnel lors de la stimulation d'un seul œil (indices monoculaires) mais dont certains nécessitent la stimulation des deux yeux (indices binoculaires). Cette thèse se concentre sur les mécanismes nécessitant les deux yeux qui mettent en jeu la différence de point de vue entre les deux yeux, aussi appelée disparité rétinienne. Les travaux présentés dans cette thèse s'inscrivent suivant deux approches majeures : une approche par la modélisation avec la simulation de l'extraction de la disparité rétinienne au niveau cortical et une approche expérimentale avec l'étude de l'influence de la disparité rétinienne sur l'attention visuelle pendant l'exploration de scènes visuelles stéréoscopiques avec enregistrements oculométriques. Le modèle proposé est construit en utilisant les données physiologiques du cortex visuel primaire V1 disponibles dans la littérature. Il effectue une estimation de la disparité rétinienne à partir des réponses modélisées des cellules simples et complexes de V1. Nous adoptons une approche bio-inspirée à deux niveaux. Le premier concerne l'architecture globale d'organisation et d'interaction des cellules corticales réalisant l'extraction d'informations à différentes fréquences spatiales, orientations et disparités, pour obtenir une estimation locale de la disparité rétinienne. Le second niveau concerne la configuration des cellules corticales implémentées comme des opérateurs de filtrage spatial. La partie expérimentale se divise elle-même en deux parties. En effet, l'utilisation de données oculométriques d'exploration de scènes 3D nécessite une étape préalable de calibration. Ainsi, nous développons une méthode de calibration 3D permettant de suivre la profondeur du regard à partir des coordonnées binoculaires enregistrées par oculométrie. Ensuite, nous analysons l'influence de la disparité rétinienne sur l'exploration visuelle de différentes catégories de scènes naturelles basées sur la présence d'indices de profondeur monoculaires et binoculaires. Nous étudions l'influence de la dominance oculaire, du biais de centralité et du biais de profondeur sur l'exploration pour chaque catégorie d'image. Un modèle de saillance 2D se montre inadapté pour prédire les zones saillantes en 3D mais également en 2D. L'information de profondeur doit être intégrée dans le calcul de la saillance grâce à la disparité rétinienne et grâce aux autres indices de profondeur pour expliquer pleinement l'exploration 2D et 3D.