Thèse en cours

Modélisation par Réseaux de Neurones Artificiels des Facteurs Psychologiques Descendants de la Cognition à la Perception

FR  |  
EN
Auteur / Autrice : Quentin Senant
Direction : Martial MermillodFrédéric Dutheil
Type : Projet de thèse
Discipline(s) : PCN - Sciences cognitives, psychologie et neurocognition
Date : Inscription en doctorat le 01/10/2023
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de Psychologie et Neuro Cognition
Equipe de recherche : Vision & Emotion (VisEmo)

Résumé

FR  |  
EN

Prédire où les gens regardent lorsqu'ils sont confrontés à différents types de stimuli visuels est un défi majeur en psychologie et en vision par ordinateur. De nombreux travaux de recherche adressent cette problématique depuis des décennies. Des expériences comportementales et des simulations computationnelles ont montré que les régions les plus regardées dépendent des propriétés de l'image ainsi que de leur contenu sémantique. Alors que la grande majorité des études ont abordé cette question en utilisant des comparaisons de modèles limitées aux scènes naturelles, peu ont analysé ces prédictions pour des visages émotionnels. Les principaux travaux, résultats comportementaux et modèles computationnels (Bruce & Tsotsos, 2009; Judd et al., 2012; Mahdi et al., 2020; Torralba et al., 2006; Walther & Koch, 2006) adressant la saillance visuelle d'images de scènes naturelles sont rassemblés sur le site web du MIT/Tuebingen Saliency benchmark : https://saliency.tuebingen.ai/ (Judd et al., 2012; Kümmerer et al., 2017). L'émotion affichée sur un visage constitue un vecteur d'information sociale attirant plus facilement l'attention que les stimuli neutres, et leur traitement privilégié est utile tant à la socialisation qu'à la survie. Le but de mon travail pour cette étude est de comparer les régions d'intérêt (ROI, pour regions of interest) issues de données en oculométrie sur des images de visages émotionnels avec des cartes de saillance LayerCAM (Jiang et al., 2015) obtenues à partir de réseaux neuronaux convolutifs pré-entraînés, ainsi que celles obtenues à partir de modèles de saillance classiques de la littérature : SUN (Zhang et al., 2008), Walther & Koch (2006) et DeepGaze IIE (Linardos et al., 2021).