Thèse soutenue

Confidentialité des Données dans le Web Sémantique des Objets

FR  |  
EN
Auteur / Autrice : Hira Asghar
Direction : Marie-Christine RoussetChristophe Bobineau
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/12/2023
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de Grenoble (2007-....)
Equipe de recherche : Scalable information discovery and exploitation (Grenoble ; 2009-....)
Jury : Président / Présidente : Claudia Lucia Roncancio
Examinateurs / Examinatrices : Silviu Maniu
Rapporteur / Rapporteuse : Pascal Molli, Benjamin Nguyen

Résumé

FR  |  
EN

Les données personnelles sont de plus en plus diffusées sur le web par l'intermédiaire d'appareils mobiles et d'environnements intelligents, et sont exploitées pour développer des services et des applications de plus en plus sophistiqués. Toutes ces avancées s'accompagnent de risques sérieux d'atteintes à la vie privée qui peuvent révéler des informations privées que les producteurs de données souhaitaient ne pas divulguer. Il est donc de la plus haute importance d'aider les producteurs de données à identifier les risques d'atteinte à la vie privée soulevés par les demandes des fournisseurs de services à des fins utilitaires.Dans cette thèse, nous abordons le problème de la préservation de la vie privée en fonction de l'utilité dans le cadre d'applications où les fournisseurs de services demandent la collecte de données auprès des producteurs de données afin d'effectuer des analyses de données agrégées à des fins d'optimisation ou de recommandation. Tout d'abord, nous traitons l'aspect temporel dans la définition de la vie privée et de l'utilité en exprimant les requêtes de vie privée et d'utilité sous forme de requêtes conjonctives agrégées temporelles. La prise en compte de l'aspect temporel pour la protection de la vie privée est très importante car de nombreuses applications traitent des données dynamiques (par exemple, la consommation d'électricité, les séries chronologiques, les données de mobilité) pour lesquelles les données temporelles sont considérées comme sensibles et les agrégats temporels sont importants pour l'analyse des données. Ensuite, nous formalisons les risques d'atteinte à la vie privée par des demandes exprimées (et gardées secrètes) par chaque producteur de données pour spécifier les données qu'il ne souhaite pas divulguer et nous développons un cadre formel pour détecter les risques d'atteinte à la vie privée. Dans notre cadre formel, nous fournissons la caractérisation des risques pour la vie privée uniquement sur la base des expressions de requête et donc indépendamment des données.Nous étendons le cadre formel en prenant en compte les connaissances ontologiques, qui aident les producteurs de données à comprendre les risques détectés pour la vie privée grâce aux explications élaborées pour chaque risque détecté. En outre, notre cadre fournit également plusieurs options pour modifier les requêtes d'utilité afin d'éliminer les risques de confidentialité détectés et ces requêtes d'utilité modifiées peuvent être envoyées aux fournisseurs de services comme base de négociation.Dans cette thèse, nous développons également une interface interactive conviviale au-dessus de la mise en œuvre du cadre formel indépendant des données.Elle aide les producteurs de données à gérer la tension entre les risques pour la vie privée et l'utilité des données qu'ils acceptent de publier.Il fournit un environnement convivial pour détecter et comprendre les risques pour la vie privée et facilite la modification des requêtes d'utilité pour éliminer les risques détectés pour la vie privée. Pour évaluer la facilité d'utilisation pratique et l'efficacité de l'interface, une étude utilisateur est menée sur un scénario de compteur intelligent inspiré d'un cas d'utilisation réel.