Apprentissage par renforcement distribué pour la tarification dynamique au sein d'agences de location de véhicules
Auteur / Autrice : | Laurie Guenin |
Direction : | Dominique Barth |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/12/2022 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Données Algorithmes pour une ville intelligente et durable |
Equipe de recherche : ALMOST | |
Référent : Université de Versailles-Saint-Quentin-en-Yvelines |
Mots clés
Mots clés libres
Résumé
Ce projet doctoral propose donc d'explorer l'utilisation de méthode de type « Machine Learning », en particulier d'apprentissage par renforcement, dans l'objectif de de développer une approche d'aide à la décision apprenant dynamiquement à sélectionner la meilleure politique de prix en fonction du marché et de son évolution. En première approche, le but est de permettre à un agent de location cible de sélectionner les meilleures actions (les prix proposés) face à un environnement. Un tel environnement (au sens de l'apprentissage par renforcement) est tout d'abord constitué ici des clients et des courtiers. L'ensemble des autres agents avec lequel l'agent cible est en concurrence pourra être modélisé soit comme un « joueur fictif »(dont le comportement devra lui même être appris au cours du temps), soit comme d'autres agents agissant au sein de l'environnement de l'agent cible, c'est à dire un système multi-agent régi par exemple par un apprentissage par renforcement distribué.