Apprentissage artificiel collectif ; aspects dynamiques et structurels
Auteur / Autrice : | Lise-Marie Veillon |
Direction : | Henry Soldano |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 08/03/2018 |
Etablissement(s) : | Sorbonne Paris Cité |
Ecole(s) doctorale(s) : | Institut Galilée (Villetaneuse, Seine-Saint-Denis) |
Partenaire(s) de recherche : | Etablissment de préparation : Université Sorbonne Paris Nord (Bobigny, Villetaneuse, Seine-Saint-Denis ; 1970-....) |
Laboratoire : Laboratoire d'Informatique de Paris-Nord / LIPN | |
Jury : | Président / Présidente : Frédéric Roupin |
Examinateurs / Examinatrices : Grégory Bonnet, Gauvain Bourgne, Amal El Fallah Seghrouchni | |
Rapporteur / Rapporteuse : Bruno Zanuttini, Lynda Tamine-Lechani |
Mots clés
Résumé
L’apprentissage collectif dans un système multi-agents considère comment une communauté constituée d’agents autonomes partageant un même objectif d’apprentissage peut bénéficier, au niveau individuel et collectif, d’échanges structurés d’informations. Les agents, reliés par un réseau de communication, ont tous la faculté de percevoir des observations, appelées exemples d’apprentissage. Cette thèse s’appuie sur un protocole pré-existant, SMILE (Sound-Multi-agent-Incremental-LEarning), qui organise un échange parcimonieux d’exemples et d’hypothèses. Ce protocole garantit, dans le cas d’agents tous connectés, que les agents obtiennent une hypothèse qui tient compte de tous les exemples perçus par l’ensemble des agents. Il existe des variantes séquentielles de ce protocole qui mettent en place une propagation de l’information pour offrir les mêmes garanties dans un réseau, non pas complet mais, connexe.Cette thèse apporte deux nouveaux éclairages sur l’apprentissage artificiel collectif. Une première étude montre l’influence de la structure du réseau sur l’apprentissage avec un protocole dont les communications sont limitées au voisinage, sans propagation. Une seconde contribution présente et analyse un nouveau protocole, Waves, qui préserve les garanties de SMILE et dont les interactions en parallèle rendent l’apprentissage en réseau plus dynamique. Ce protocole est évalué en détail,dans un contexte simplifié de tour par tour, ce qui permet de le raffiner par la suite avec diverses améliorations. Il est cependant conçu pour s’adapter à un apprentissage en ligne et une acquisition non limitée, ni en temps ni en nombre, de nouveaux exemples par la communauté.