L'apprentissage profond et par renforcement pour l'optimisation du routage automatique dans un environnement multi-critères complexe et multi-agents : cas de l'affectation dynamique des ressources dans un contexte de régulation des urgences.
Auteur / Autrice : | Omar Elfahim |
Direction : | Oussama Barakat, Mohamed Youssfi |
Type : | Projet de thèse |
Discipline(s) : | Sciences pour l'Ingénieur |
Date : | Inscription en doctorat le 14/06/2022 |
Etablissement(s) : | Besançon, Université Marie et Louis Pasteur en cotutelle avec Université Hassan II de Casablanca (UH2C) |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Soins Intégrés, Nanomédecine, IA & Ingénierie pour la Santé |
établissement de préparation : Université de Franche-Comté (1971-....) |
Résumé
L'objectif de cette thèse étant de créer de nouveaux modèles basés sur les techniques de l'Intelligence Artificielle dans un contexte distribué et de les appliquer aux problématiques des systèmes de santé. L'idée est d'apprendre à des agents quelconques à évoluer en empruntant le parcours optimal dans un environnement dynamique, complexe et sous des contraintes multiples. Dans ce travail de recherche, nous allons nous intéresser aux techniques de Deep Reinforcement Learning, qui consiste à utiliser conjointement les algorithmes du deep learning comme CNN, RNN et LSTM pour l'abstraction de l'environnement et des techniques de l'apprentissage par renforcement comme le Q-Learning pour piloter le système de routage d'un agent évoluant dans un environnement complexe. Le travail de recherche se basera aussi sur une approche IAD (Intelligence Artificielle Distribuée) en utilisant les SMA (Systèmes Multi-Agents) comme approche de modélisation. Nous nous intéresserons aux applications dans le domaine de la santé : l'automatisation du processus de décision d'affectation des ressources dans un contexte des urgences hospitalières.