Thèse en cours

Emergence du langage dans des populations d'agents artificiels
FR  |  
EN
Auteur / Autrice : Mathieu Rita
Direction : Emmanuel DupouxOlivier Pietquin
Type : Projet de thèse
Discipline(s) : Sciences cognitives
Date : Inscription en doctorat le 01/09/2021
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Cerveau, cognition, comportement
Partenaire(s) de recherche : Laboratoire : Laboratoire de sciences cognitives et psycholinguistique (1985-....)
Equipe de recherche : CoML - Cognitive Machine Learning
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)

Résumé

FR  |  
EN

Contexte : Les progrès récents en apprentissage profond ont conduit au développement de neurones réseaux capables d'accomplir des tâches complexes dans des domaines variés tels que la vision ou le langage. Ces succès sont atteints par des réseaux entrainés sur des grands jeux de données. Cependant, les aspects interactifs et fonctionnels de l'intelligence sont presque complètement ignorés dans la conception de réseaux de neurones. Au delà du succès de l'apprentissage profond dans des tâches très précises, il sied donc de questionner l'agilité des réseaux à interagir, notamment via l'introduction de canaux de communication, dans des environnements multi-agents. Cette thèse vise à étudier les prérequis à l'émergence d'une communication utile et structurée dans des populations d'agents artificiels. D'un point de vue scientifique, comprendre l'évolution des langues dans des communautés d'agents artificiels et les propriétés émergentes du langage peut apporter des connaissances nouvelles pour questionner les hypothèses sur l'émergence et l'évolution du langage humain. D'un point de vue applicatif, doter les réseaux d'une capacité à résoudre des problèmes de manière interactive en communiquant entre eux et avec les humains devraient les rendre plus flexibles et utiles dans la vie de tous les jours. Nous présentons ici les axes de recherche que nous prévoyons de mener au cours de la thèse. Lignes de recherche : Nous envisageons deux axes de recherche parallèles. Le premier consiste à étudier les propriétés des langages émergents dans le cadre de configurations à deux agents. De nombreuses questions restent sans réponse concernant la structure des langages émergents lors de jeux simples à deux agents. En particulier, il se pose la question des conditions nécessaires à l'émergence de structures linguistiques comme celle que nous pouvons observer chez les humains. Notre objectif est d'analyser les prérequis au développement de telles structures. Nous prévoyons d'étudier un large éventail de biais qui pourraient être appliqués au système : biais de modélisation, régularisation de l'environnement, canaux de communication contraints, etc. Deuxièmement, nous visons à adapter ces idées dans des expériences impliquants plus de deux agents. Nous prévoyons de concevoir des expériences impliquant des populations d'agents et qui permettraient d'interroger les hypothèses sur les origines des langues. Premières expériences envisagées : 1ère ligne de recherche : étude des structures linguistiques et de l'influence des biais de modélisation dans des jeux de communications à deux agents 1. Analyser les prérequis à l'émergence de communications aux propriétés structurelles proche de celle des humains (exemples : efficacité du langage, compositionalité, aptitude à généraliser). 2. Passer de la communication de structures de données très simples (vecteurs unitaires) à la communication de structures plus complexes (composition de vecteurs unitaires, graphes, images). L'idée ici est d'envisager une étude progressive afin de mieux comprendre l'origine des structures linguistiques. 3. Introduire une compétition entre différentes modalités de sorte à questionner le rôle et l'influence du langage dans la réussite des jeux. 2ème ligne de recherche : développement d'expériences impliquant des populations d'agents (>2 agents) permettant de simuler l'apprentissage et l'émergence du langage/communication 1. Implémentation d'expériences (le succès et la convergence de telles expériences est déjà un challenge en soi). 2. Proposer une mesure de la « quantité » de communication dans la population 3. Connecter la quantité de communication au degré de centralisation de la récompense des agents (récompense partagée par tous les agents ou récompense individuelle) 4. Questionner l'impact de la structure social entre les agents sur la communication émergente Remarques de conclusion : On décrit ici très brièvement les deux lignes de recherche principale. Toutefois, une partie des points mentionnés ci-dessus impliquent des défis techniques non négligeables. L'éventail de ce projet de thèse se veut donc suffisamment large pour pouvoir rebondir face à d'éventuels échecs.