Cοοrdinatiοn d'une flοtte hétérοgène de rοbοts pοur la récοlte d'infοrmatiοn dans un envirοnnement incοnnu
Auteur / Autrice : | Alvin Gandois |
Direction : | Abdel-Illah Mouaddib, Ayman Al Falou |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 11/12/2024 |
Etablissement(s) : | Normandie |
Ecole(s) doctorale(s) : | École Doctorale Mathématiques, Information, Ingénierie des Systèmes |
Partenaire(s) de recherche : | Laboratoire : Groupe de recherche en informatique, image et instrumentation de Caen |
Établissement co-accrédité : Université de Caen Normandie | |
Jury : | Président / Présidente : Régis Sabbadin |
Examinateurs / Examinatrices : Régis Sabbadin, François Charpillet, Aurélie Beynier, Simon Le Gloannec | |
Rapporteurs / Rapporteuses : François Charpillet, Aurélie Beynier |
Mots clés
Résumé
Dans cette thèse, nous étudions le problème de la récolte d'information dans un environnement inconnu et partiellement observable avec des agents hétérogènes. Nous considérons un environnement composé de différents points d'intérêt, avec pour objectif de coordonner des agents hétérogènes dans le but de récolter de l'information sur ces points d'intérêt. L'hétérogénéité des agents peut apparaître sous différentes formes : plusieurs agents ayant des capacités d'observation différentes, des capacités d'embarquement différentes, des ressources différentes, ou bien un seul agent embarquant plusieurs capteurs hétérogènes. Dans un premier temps, nous avons proposé un modèle de récolte d'information avec plusieurs agents hétérogènes dans un environnement partiellement observable mais topologiquement connu. Ce modèle, que nous avons nommé Meta-MDP, est basé sur les processus décisionnels de Markov, et fonctionne en deux parties : premièrement, pour chaque agent et chaque point d'intérêt, nous calculons une politique pour récolter de l'information sur ce point. Ensuite, nous calculons une politique d'allocation des points d'intérêts aux agents de manière à optimiser la récolte d'information sur le long terme. Nous avons ensuite étendu ce modèle au cas où nous avons un agent embarquant plusieurs capteurs hétérogènes (typiquement un capteur laser et une caméra) dans un environnement inconnu dans le but de construire une carte de l'environnement tout en récoltant de l'information sur les éventuels points d'intérêt.