Thèse soutenue

Attention sélective en visualisation d'images fixes et animées affichées sur écran : modèles et évaluation de performances - application

FR
Auteur / Autrice : Olivier Le Meur
Direction : Dominique BarbaPatrick Le Callet
Type : Thèse de doctorat
Discipline(s) : Automatique et Informatique appliquée. Traitement du signal et des images
Date : Soutenance en 2005
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale sciences et technologies de l'information et des matériaux (Nantes)
Partenaire(s) de recherche : autre partenaire : Université de Nantes. Faculté des sciences et des techniques - Centrale Nantes (1991-....) - École nationale supérieure des mines (Nantes1990-2016)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Cette étude traite de la modélisation de l'attention visuelle pré-attentive (ou plus communément appelé Bottom-Up) sur images fixes couleurs et sur séquence d'images animées. Il s'agit donc de déterminer de façon automatique et en utilisant uniquement des caractéristiques visuelles de bas niveaux les zones attirant le regard. Nous proposons d'abord de construire un espace psycho-visuel dans lequel les signaux achromatique et chromatiques sont normalisés en fonction de leur propre seuil différentiel de visibilité. L'intérêt est ici d'exprimer les différentes caractéristiques visuelles avec la même unité, c'est à dire en terme de visibilité. Ensuite, plusieurs transformations sont effectuées pour déterminer la saillance spatiale achromatique et chromatiques, toutes basées sur une modélisation d'inspiration biologique des mécanismes perceptifs humains (suppression de la redondance locale, interactions facilitatrices de type iso-orienté et co-linéaire. . . ). Une méthode de fusion est proposée permettrant de déduire la carte de saillance spatiale finale. L'évaluation des performances de la modélisation est réalisée en comparant nos résultats avec des résultats provenant de tests oculométriques sur un panel d'observateurs. Pour cela, trois métriques sont utilisées: le coefficient de corrélation linéaire, la divergence de Kullback-Leibler et une méthode de classification. Comparativement au modèle de L. Itti considéré comme le modèle de référence, et quelle que soit la métrique utilisée, notre modèle fournit en moyenne de meilleurs résultats. L'extension à la dimension temporelle a été réalisée permettant de détecter les zones saillantes dans les vidéo. A partir des données achromatiques de l'espace psycho-visuel, la saillance temporelle est déduite des contrastes locaux de mouvement de la séquence d'images. La fusion de la saillance spatiale et de la saillance temporelle conduit à la carte de saillance finale. A partir de nouveaux tests oculométriques, une nouvelle évaluation est alors effectuée. En moyenne, le modèle spatio-temporel de saillance détecte 77% des zones saillantes. Finalement, deux applications utilisant les cartes de saillance sont décrites. La première concerne le codage vidéo H. 264 pour laquelle l'objectif est de privilégier la qualité sur les zones visuellement importantes. La seconde traite de la création d'images ou de séquences d'images miniatures permettant d'augmenter le confort visuel lorsque l'écran d'affichage est de faible taille.