Thèse soutenue

Théories des jeux pour les communications militaires tactiques

FR  |  
EN
Auteur / Autrice : Mahmoud Almasri
Direction : Ali Mansour
Type : Thèse de doctorat
Discipline(s) : Télécommunications, Informatique
Date : Soutenance le 27/04/2020
Etablissement(s) : Brest, École nationale supérieure de techniques avancées Bretagne
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance - Laboratoire des sciences et techniques de l'information, de la communication et de la connaissance
Jury : Président / Présidente : Emanuel Rădoi
Examinateurs / Examinatrices : Christian Jutten, Christophe Moy, Vincent Choqueuse, Ammar Assoum
Rapporteur / Rapporteuse : Karim Abed-Meraim, Nadège Thirion-Moreau

Résumé

FR  |  
EN

Durant le siècle passé, les ressources spectrales ont été allouées aux services qui sont apparus au fur et à mesure des années. Avec une augmentation soutenue des besoins en bandes fréquentielles d'applications de communication sans fil, les opérateurs de radiocommunication se sont trouvés face à une pénurie. Néanmoins, des études initiées par la Commission fédérale des communications (FCC : Federal Communications Commission) ont montré que les bandes de fréquences sont mal exploitées : certaines bandes sont peu chargées, d'autres sont surchargées. L'Accès Opportuniste au Spectre (AOS) dans une radio cognitive représente une potentielle solution proposée pour lutter contre un manque accru du spectre et améliorer le rendement de l’utilisation. Dans un AOS, deux catégories d'utilisateurs sont définis : les utilisateurs primaires (PU), possédant les licences, ont un droit exclusif d'accéder à leurs bandes fréquentielles en permanence ; et les utilisateurs secondaires (SU) ou opportunistes qui cherchent à exploiter les bandes de fréquences libérer par un PU. [...] Pour identifier le meilleur canal, nous avons proposé un modèle d'AOS en se basant sur un problème de multi-arm bandit (MAB), dans lequel un joueur joue une seule machine à sous à chaque tournée en espérant de découvrir la meilleure machine qui augmentera son gain. Plusieurs algorithmes ont été développés pour mieux aborder le problème du MAB, notamment Thompson Sampling (TS), Upper Confidence Bound (UCB), e-greedy. Nous avons analysé et comparé les performances des algorithmes TS, UCB, et e-greedy. Nous avons proposé deux nouveaux variétés de l’algorithme UCB : e-UCB et AUCB. Les deux derniers algorithmes ont donné une grande satisfaction en montrant des meilleures performances que les autres variantes bien connues des algorithmes UCB ou e-greedy, dans lesquelles le SU peut rapidement estimer la probabilité de disponibilité des canaux sans préalable information. Nous avons ensuite étudié un cas plus général où plusieurs utilisateurs secondaires coexistent, le principal goal de ces SU reste à trouver la meilleur stratégie (apprentissage coopératif) ou les stratégies individuelles (apprentissage compétitif) pour mieux estimer les probabilités de disponibilité des canaux. Les travaux les plus récents concentrent sur l'accès aléatoire alors que l'accès priorité n'est pas suffisamment pris en compte dans la littérature. En fait, l'accès priorité peut avoir un rôle important dans les réseaux tactiques dans lesquels plusieurs SU existent avec certains niveaux de hiérarchie. Dans nos études et pour un réseau tactique avec une certaine hiérarchie, nous avons proposé deux stratégies, l’une coopérative : Side Channel ; l’autre compétitive : All-Powerful Learning (APL). Selon ces deux stratégies, chaque SU a un rang fixe, et son objectif est d'accéder aux canaux disponibles en respectant son rang. Side Channel et APL prennent en compte un accès prioritaire et dynamique, où les utilisateurs peuvent entrer ou sortir du réseau à tout moment. Dans la littérature, un accès prioritaire ou un accès dynamique ont été séparément évoqués. Finalement une étude de performance théorique a été développée pour les stratégies d'apprentissage proposées. Les simulations ont montré que Side Channel et APL ont donné les meilleurs résultats par rapport à la littérature. En appliquant l’une de ces deux stratégies, les utilisateurs secondaires peuvent rapidement identifier les canaux correspondants à leurs rangs tout en réduisant le nombre de collisions parmi eux.