Vers des usines autonomes grâce à l'apprentissage par renforcement multi-agents coopératifs

par Jean-marc Alkazzi

Projet de thèse en Informatique

Sous la direction de Michel Salomon et de Elias Doumith.

Thèses en préparation à Bourgogne Franche-Comté , dans le cadre de École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; Dijon ; Belfort) , en partenariat avec FEMTO-ST Franche Comté Electronique Mécanique Thermique et Optique - Sciences et Technologies (laboratoire) et de DISC - Département Informatique et Systèmes Complexes (equipe de recherche) depuis le 01-03-2019 .


  • Résumé

    L'apprentissage par renforcement gagne en popularité en tant que science de la prise de décision. Un agent apprend à agir dans un environnement spécifique à travers plusieurs expériences afin de maximiser sa récompense à long terme. Cela rend un agent assez intelligent, mais qu'en est-il d'un groupe d'agents ? Comment peuvent-ils apprendre à collaborer ? Que se passe-t-il si de nouveaux agents sont ajoutés ou supprimés ? C'est le domaine de l'apprentissage par renforcement multi-agents, domaine qui aidera la société BMW à faire un pas vers l'automatisation de leurs usines en tirant parti de la coopération des robots pour atteindre une tâche commune.

  • Titre traduit

    Towards Autonomous Factories with Multi-Agent Reinforcement Learning.


  • Résumé

    Reinforcement Learning is gaining popularity for being the Science of Decision making. An agent learns how to take actions in a specific environment throughout several experiences as to maximize its long term reward. This makes one agent smart enough, but what about a group of agents? How can they learn to collaborate? What happens if new agents are added or removed? This is the field of Multi-Agent Reinforcement Learning and it will help BMW make a step towards automating their factories by leveraging cooperation of robots to achieve a common task.