Apprentissage et prédiction de séquences sensori-motrices : architecture neuromimétique pour la navigation et la planification d'un robot mobile
Auteur / Autrice : | Nicolas Cuperlier |
Direction : | Mathias Quoy |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2006 |
Etablissement(s) : | Cergy-Pontoise |
Ecole(s) doctorale(s) : | École doctorale Sciences et ingénierie (Cergy-Pontoise, Val d'Oise) |
Partenaire(s) de recherche : | Autre partenaire : Ecole nationale supérieure de l'électronique et de ses applications (Cergy, Val-d'Oise) |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La navigation autonome d’un robot mobile en environnement inconnu est une tâche complexe qui soulève de nombreux problèmes liésà la perception, la categorisation, la planification et au contrôle moteur. Résoudre l’ensemble de ces problèmes de manière intégrée demeure un défi pour les roboticiens. Ainsi nous proposons une architecture neuronale unifiée, fondée sur la modélisation de fonctionnalités de différentes parties du cerveau des mammifères: l’hippocampe, le cortex prefrontal et les ganglions de la base. L’intégration de données multimodales telles que la vision (entrée principale), l’intégration de chemin, et la motivation ainsi que les interactions internes et externes des différentes structures en sont des points importants. Une première partie de notre travail a ainsi consisté à modéliser des réseaux de neurones permettant l’apprentissage et la prédiction d’associations sensorimotrices, sous la forme de cellules de transition, supports d’une carte cognitive employée afin d’effectuer une planification selon des motivations parfois contradictoires. . . L’apprentissage de la carte cognitive, lors de périodes d’exploration et réalisé de façon latente, sans utiliser de coordonnées cartésiennes ni de grille d’occupation. Les liens de cette carte sont appris ou renforces selon le comportement supportant ainsi des changements dynamiques de l’environnement. Les périodes d’explorations peuvent être entrecoupées de période de planification. La deuxieme partie de cette these apporte à notre modele une solution pour explorer de fa¸conpréférentielle les zones inconnues de l’environnement et d’améliorer la précision du mouvement planifié via une compétition souple (à plusieurs gagnants), offrant une meilleure généralisation du mouvement et par conséquent un déplacement plus précis en planification. La commande motrice finale correspond à la solution stable d’un système dynamique : un champ neuronal à une dimension. Notre modele fournit ainsi une architecture de controle capable d’exhiber sur une plate forme robotique des comportements de navigation inspirés de la biologie. Cette architecture peut donc être considérée comme une tentative d’explication des mécanismes sous-jacent mis en oeuvre par les mammifères dans ces types de comportement. D’autre part les capacités de notre modèle en terme de localisation, d’exploration active, de planification et de cartographie en ligne d’un environnement incomplètement exploré en font une proposition originale au problème du S. L. A. M (Simultaneous Localization and Map building of an unknown environment).