Thèse soutenue

Bandits massifs multi-bras multi-joueurs pour les réseaux de l’internet des objets

FR  |  
EN
Auteur / Autrice : Hiba Dakdouk
Direction : Patrick Maillé
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 30/05/2022
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Dependability Interoperability and perfOrmance aNalYsiS Of networkS - Département Systèmes Réseaux, Cybersécurité et Droit du numérique - Institut de recherche en informatique et systèmes aléatoires (Rennes)
Entreprise : Orange (Firme)
Jury : Président / Présidente : Vianney Perchet
Examinateurs / Examinatrices : Patrick Maillé, Yezekael Hayel, Nadège Varsier, Raphaël Féraud, Michele Zorzi
Rapporteurs / Rapporteuses : Vianney Perchet, Yezekael Hayel

Résumé

FR  |  
EN

Cette thèse de doctorat étudie le problème d’optimisation de la performance des réseaux de l’Internet des objets (IoT). L’objectif est de maximiser le succès des communications dans les réseaux de l’IoT, en proposant des algorithmes de prise de décision dynamiques efficaces pouvant être intégrés dans les futurs équipements IoT, tout en respectant leurs contraintes de faible complexité et de faible consommation d’énergie. Pour cela, l’apprentissage par renforcement (RL) est utilisé et le problème d’optimisation est modélisé comme un problème de bandit multi-joueurs multi-bras (MP-MAB), adapté aux réseaux IoT et permettant de surmonter de nombreuses hypothèses irréalistes dans le cadre des réseaux IoT précédemment effectuées dans la littérature. Dans cette thèse, deux approches différentes sont proposées pour traiter le problème d’optimisation. La première approche permet de blacklister les mauvais canaux de propagation d’un réseau en utilisant un algorithme collaboratif d’identification des meilleurs bras. La seconde approche consiste en deux politiques différentes qui attribuent de manière récursive chaque équipement IoT à un canal ; la première politique se concentre sur le nombre de communications réussies tandis que l’autre garantit un niveau d’équité entre les équipements. Dans un premier temps, nous avons effectué l’étude numérique et expérimentale des différents algorithmes développés pendant cette thèse afin de montrer qu’ils étaient capables de surclasser les autres algorithmes de la littérature. Dans un second temps, une partie importante du travail a consisté en l’application des algorithmes développés au problème concret de choix de la puissance d’émission et du facteur d’étalement dans un réseau LoRa, en analysant les performances en termes de qualité de service et de consommation d’énergie à l’aide d’un simulateur de réseau LoRa réaliste entièrement redéveloppé en C durant la thèse.