Thèse soutenue

Gestion de la redondance des donnees dans environnements connectes

FR  |  
EN
Auteur / Autrice : Faisal SHAHZAD
Direction : Richard ChbeirJoe M. Tekli
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 16/12/2021
Etablissement(s) : Pau
Ecole(s) doctorale(s) : École doctorale sciences exactes et leurs applications (Pau, Pyrénées Atlantiques ; 1995-)
Partenaire(s) de recherche : Laboratoire : LABORATOIRE D'INFORMATIQUE DE L'UPPA (LIUPPA) - Laboratoire Informatique de l'Université de Pau et des Pays de l'Adour
Jury : Examinateurs / Examinatrices : Djamal Benslimane, Allel Hadjali, Ahmed Mostefaoui
Rapporteurs / Rapporteuses : Djamal Benslimane, Allel Hadjali, Ahmed Mostefaoui

Résumé

FR  |  
EN

L’évolution significative des technologies de traitement, transmission, et modélisation des données ainsi que l’avancement technique réalisé au niveau des réseaux de capteurs ont contribué à la prolifération des environnements connectés (ex : bâtiments,villes intelligents). Ces environnements contiennent divers capteurs qui surveillent notre vie quotidienne et génèrent une quantité massive de données / observations.Par conséquent, le nombre de données à transmettre et stocker sur le réseau (localement sur les capteurs ou dans des bases de données) devient problématique.De plus, les capteurs surveillant l’environnement en temps réel produisent souvent des données redondantes qui ne sont pas nécessairement utiles (par exemple,enregistrer les mêmes phénomènes inchangés pendant une période de temps).Ceci provoque plusieurs problèmes (par exemple, la saturation de la bande passante du réseau, la surconsommation d’énergie du réseau / capteurs, des problèmes destockage). Les techniques de prétraitement des données telles que la détection et le nettoyage de la redondance (c’est-à-dire la déduplication) pourraient aider à réduire a quantité de données traitées, transmises et stockées dans des environnements connectés.Dans cette thèse, nous nous concentrons sur trois défis principaux: (I) détecter avec précision les redondances de données dans des environnements connectés ; (II)prendre en compte les caractéristiques environnementales physiques (par exemple,les séparations des zones/localisations), les caractéristiques des capteurs (par exemple,les zones de couverture), et la dynamique de l’environnement connecté (par exemple,la mobilité des capteurs) lors de la détection des redondances ; et (III) fournir des mécanismes flexibles et configurables de nettoyage des redondances pour faire face aux besoins des consommateurs de données (par exemple, les utilisateurs, les services, les équipements, les besoins de stockage).Pour ce faire, nous proposons :• une approche, dénotée DRMF, pour la détection des données redondantes au niveau des capteurs,• une amélioration de DRMF, dénotée FREDD, basée sur le raisonnement flou pour améliorer la détection au niveau des capteurs,• une extension de FREDD permettant de détecter les redondances au niveau intermédiaire (niveau "Sink"), et• une approche pour le nettoyage des redondances détectées qui assure une flexibilité pour adapter la déduplication aux besoins et recommandations des consommateurs de données.Nous regroupons tous ces modules dans un framework global nommé DRMCE pour la gestion de la redondance des données dans des environnements connectés.Notre proposition est 1) adaptative car permet de personnaliser la déduplication des données redondantes soit localement sur les capteurs ou au niveau des noeuds Sinks,et 2) générique car pourrait être utilisée dans différents environnements connectés tels que les bâtiments, les villes, et parkings intelligents.