Thèse en cours

Cοοrdinatiοn d'une flοtte hétérοgène de rοbοts pοur la récοlte d'infοrmatiοn dans un envirοnnement incοnnu

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu le 11/12/2024. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Alvin Gandois
Direction : Abdel-Illah MouaddibAyman Al falou
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 13/10/2021
Soutenance le 11/12/2024
Etablissement(s) : Normandie
Ecole(s) doctorale(s) : École Doctorale Mathématiques, Information, Ingénierie des Systèmes
Partenaire(s) de recherche : Laboratoire : Groupe de recherche en informatique, image et instrumentation de Caen
Établissement co-accrédité : Université de Caen Normandie
Jury : Examinateurs / Examinatrices : Simon Le gloannec, Aurélie Beynier, Regis Sabbadin, Abdel-Illah Mouaddib, Francois Charpillet, Ayman Al falou
Rapporteur / Rapporteuse : Francois Charpillet, Aurélie Beynier

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans cette thèse, nous étudions le problème de la récolte d'information dans un environnement inconnu et partiellement observable avec des agents hétérogènes. Nous considérons un environnement composé de différents points d'intérêt, avec pour objectif de coordonner des agents hétérogènes dans le but de récolter de l'information sur ces points d'intérêt. L'hétérogénéité des agents peut apparaître sous différentes formes : plusieurs agents ayant des capacités d'observation différentes, des capacités d'embarquement différentes, des ressources différentes, ou bien un seul agent embarquant plusieurs capteurs hétérogènes. Dans un premier temps, nous avons proposé un modèle de récolte d'information avec plusieurs agents hétérogènes dans un environnement partiellement observable mais topologiquement connu. Ce modèle, que nous avons nommé Meta-MDP, est basé sur les processus décisionnels de Markov, et fonctionne en deux parties : premièrement, pour chaque agent et chaque point d'intérêt, nous calculons une politique pour récolter de l'information sur ce point. Ensuite, nous calculons une politique d'allocation des points d'intérêts aux agents de manière à optimiser la récolte d'information sur le long terme. Nous avons ensuite étendu ce modèle au cas où nous avons un agent embarquant plusieurs capteurs hétérogènes (typiquement un capteur laser et une caméra) dans un environnement inconnu dans le but de construire une carte de l'environnement tout en récoltant de l'information sur les éventuels points d'intérêt.