Apprentissage non supervisé de représentations sensorimotrices

par Clément Masson

Projet de thèse en Informatique

Sous la direction de David Filliat.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale INTERFACES : approches interdisciplinaires / fondements, applications et innovation (Palaiseau, Essonne ; 2015-....) , en partenariat avec U2IS - Unité d'Informatique et d'Ingénierie des Systèmes  (laboratoire) et de École nationale supérieure de techniques avancées (Palaiseau, Essonne) (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    Le principal but de la thèse est de permettre à un robot de se créer de manière autonome une représentation de son environnement à partir des signaux sensorimoteurs dont il dispose. Là ou des techniques supervisées fournissent à la machine un grand nombre de signaux sensoriels (par exemple des images ou des sons) associés à une classe donnée (par exemple 'chat' ou 'table'), nous essayons au contraire de permettre à la machine de découvrir automatiquement ces classes en se basant uniquement sur les signaux sensorimoteurs. Une particularité de la thèse est de s'interesser à l'utilisation simultanée de plusieurs modalités sensorielles (vision, ouïe, touché, proprioception...) afin d'atteindre ce but et d'étudier l'avantage que cela peut procurer comparé à un apprentissage basé sur une unique modalité. Il est envisagé pour cela d'utiliser l'apprentissage profond ou "Deep Learning"

  • Titre traduit

    Unsupervised learning of sensorimotor representations


  • Résumé

    The main goal of this thesis is to enable a robot to create autonomously a representation of its environment from its available sensorimotor inputs. While supervised techniques provide the machine with numerous sensory inputs (e.g. images or sounds) associated with a category (e.g. 'cat' or 'table'), we try on the contrary to enable the machine to discover autonomously these categories using only sensory inputs. A peculiarity of this thesis is to investigate the simultaneous use of several sensory modalities (vision, hearing, touch, proprioception ...) in order to reach this goal and to study the advantages that this can offer compared to learning from a unique modality. We will consider using Deep Learning for that purpose.