Coopération entre les aires corticales pour l'acquisition des capacités de reconnaissance visuelle invariante : modélisation fonctionnelle
Auteur / Autrice : | Latifa Boutkhil |
Direction : | Michel Imbert |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences cognitives |
Date : | Soutenance en 2002 |
Etablissement(s) : | Paris, EHESS |
Mots clés
Résumé
Nous pouvons reconnaître des objets alors que des changements de points de vue, de la position de l’œil, de taille, d’orientation, de position relative ou des déformations de l’objet lui-même (par exemple d’un journal ou d’un gymnaste) modifient de manière notable leurs projections rétiniennes. Comment cette capacité cognitive peut-elle être apprise ? C’est à cette question que nous tentons de répondre dans ce travail, qui s’inscrit dans le cadre des Sciences Cognitives, associant neurosciences, psychologie expérimentale et modélisation connexionniste pour prendre en compte la richesse du substrat biologique et la multiplicité des apprentissages du nourrisson. On tente de décrire une utilisation progressive des différentes sources d’informations sensorielles et motrices à partir de la logique de maturation du système nerveux, dans un même réseau connexionniste dont la combinatoire est la plus proche possible, dans ses grandes lignes, de celle du cortex visuel. Dans le cadre de ce réseau connexionniste, on s’attache au problème de l’acquisition de l’invariance visuelle que l’on décompose en une suite d’apprentissages progressifs à partir des données développementales, et on s’intéresse à l’enchaînement causal généré par ce réseau, liant par exemple le développement de l’exploration oculaire et celui des capacités perceptives. Le chapitre I pose les bases conceptuelles du connexionnisme, en s’attachant plus particulièrement aux capacités d’invariance relative des différents modèles de réseaux de neurones « classiques » et à leurs limites. Le chapitre II. A présente une synthèse minimaliste quant aux données issues de la neurobiologie, de psychologie expérimentale, concernant l’architecture du système visuel, avec pour grille d’analyse le problème de la représentation des objets dans le but d’obtenir une reconnaissance invariante. Un avant-propos à cette partie fera le point sur les principales théories de reconnaissance invariante. Le chapitre II. B propose une revue de l’existant comme solutions connexionnistes au problème de la reconnaissance visuelle invariante, à savoir une classification des différents modèles de réseaux de neurones, plausibles biologiquement ou non, ordonnée en quatre grandes méthodes d’obtention de l’invariance : i) Invariance par le codage de la forme d’entrée (transformation locale ou globale) ; ii) Invariance par apprentissage de la transformation géométrique ; iii) Invariance par la structure du réseau de neurones ou méthodes de corrélation ; iv) Invariance 3D par interpolation entre des vues 2D : a) mémorisation de prototypes par réseaux connexionnistes de type RBF et b) exploitation de l’information de contiguïté spatio-temporelle. Le chapitre III s’attache, à la lumière des concepts du chapitre I, aux opérations neurales réalisées par le cortex visuel en tant qu’architecture de réseau de réseaux de « colonnes » corticales. Dans ce paradigme connexionniste, une évaluation fonctionnelle des capacités d’invariance d’un modèle du système visuel est proposée à partir de deux simulations sur réseau de transputers pour une application de reconnaissance de caractères. Les propriétés d’invariance en translation et en homothétie obtenues, résultent principalement des coopérations entre deux réseaux (l’un modélisant la voie temporale du cortex visuel, dédié plus particulièrement à l’identification, l’autre modélisant la voie pariétale dédiée à la perception de l’espace et son exploration oculaire). Pour atteindre l’objectif de cette thèse qui consiste à mettre en correspondance les étapes de développement visuel du jeune enfant avec la mise en place des relations fonctionnelles qui peuvent permettre la constance perceptive, le chapitre IV propose une modélisation fonctionnelle qui resitue aux différents niveaux de l’architecture du système visuel en développement les modèles de réseaux neuronaux proposés au chapitre II. B pour résoudre le problème de l’invariance perceptive. Cette modélisation fonctionnelle s’appuie également sur les mécanismes validés par simulation au chapitre III.