Thèse soutenue

Protocoles de routage basés sur l'apprentissage par renforcement pour l'optimisation de la durée de vie et de l'énergie des réseaux de capteurs sans fil

FR  |  
EN
Auteur / Autrice : Elvis Obi
Direction : Zoubir MammeriJacques Jorda
Type : Thèse de doctorat
Discipline(s) : Informatique et télécommunications
Date : Soutenance le 10/07/2023
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)
Jury : Président / Présidente : Thierry Gayraud
Examinateurs / Examinatrices : Zoubir Mammeri, Jacques Jorda, Samia Bouzefrane, Pascal Lorenz, Abderrezak Rachedi, Aliyu Danjuma usman
Rapporteurs / Rapporteuses : Samia Bouzefrane, Pascal Lorenz

Résumé

FR  |  
EN

L'optimisation énergétique des nœuds capteurs dans les Réseaux de Capteurs Sans Fil (RCSF) constitue un enjeu d'une importance primordiale. En effet, les nœuds capteurs font face à des ressources énergétiques limitées et sont principalement déployés dans des environnements complexes, ce qui confère une importance cruciale à la durée de vie du réseau étant donné qu'il est impossible de les remplacer ou de les recharger. Pour résoudre cette problématique, il est envisageable de concevoir des protocoles de routage économes en énergie qui exploitent l'Apprentissage par Renforcement (AR). La plupart des protocoles de routage RCSF basés sur l'AR sont distribués et s'adaptent aux environnements dynamiques, ce qui réduit la complexité et le temps d'apprentissage. Toutefois, ils peinent à trouver des routes optimales à l'échelle globale, ce qui entraîne une diminution de la durée de vie du réseau et de la consommation d'énergie. Un protocole centralisé basé sur l'AR permet de relever ce défi en profitant d'une vision globale des RCSF. Cette thèse présente trois contributions majeures. Tout d'abord, un protocole de routage, basé sur l'algorithme Q-learning, centralisé conscient de la durée de vie (LACQRP) est proposé pour maximiser la durée de vie du réseau. Q-learning est mis en œuvre au niveau de la passerelle possédant une connaissance globale du réseau. En générant tous les arbres couvrants de poids minimum basés sur la distance (All-MST), qui représentent l'ensemble des tables de routage (RT) pour un RCSF composé de 100 nœuds de capteurs, et en apprenant les RT qui minimisent la consommation d'énergie maximale des nœuds, LACQRP atteint une durée de vie optimale du réseau avec de meilleures performances que les protocoles de routage basés sur l'AR distribués tels que le Routage Basé sur l'AR (RLBR) et l'AR pour l'Optimisation de la Durée de Vie (R2LTO). Cependant, le temps de calcul de LACQRP augmente de manière exponentielle avec le nombre de nœuds capteurs. Ensuite, une méthode appelée Protocole de Routage Centralisé pour l'Optimisation de la Durée de Vie avec l'AR et un Algorithme Génétique (CRPLOGAQL) est proposée pour réduire le temps de calcul de LACQRP. En remplaçant All-MSTs de LACQRP par des arbres couvrants de poids minimal basés sur un algorithme génétique (GA), CRPLOGAQL parvient à un routage sous-optimal avec un temps de calcul réduit. Néanmoins, les protocoles centralisés basés sur l'AR avec des espaces d'états et d'actions importants utilisant Q-learning de référence entraînent une réduction de la durée de vie du réseau et une augmentation de la consommation d'énergie en raison de l'apprentissage approfondi nécessaire pour déterminer les RT optimaux. Enfin, une technique efficace d'AR sans modèle appelée Itération de Politique par Moindres Carrés (LSPI) est utilisée pour optimiser la durée de vie du réseau et la consommation d'énergie dans les RCSF, surmontant ainsi les limites de Q-learning. Le protocole résultant, appelé Protocole de Routage Centralisé pour l'Optimisation de la Durée de Vie et de l'Énergie avec l'AR, l'Algorithme Génétique et LSPI (CRPLEOGALSPI), surpasse CRPLOGAQL en prenant en compte tous les RT possibles dans un état donné, indépendamment du taux d'apprentissage.