Débruitage de signaux définis sur des graphes de grande taille avec application à la confidentialité différentielle
Auteur / Autrice : | Elie Chedemail |
Direction : | Fabien Navarro, Basile de Loynes, Baptiste Olivier |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 21/12/2023 |
Etablissement(s) : | Rennes, École Nationale de la Statistique et de l'Analyse de l'Information |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Centre de recherche en économie et statistique (France) - Centre de Recherche en Economie et Statistique [Bruz] / CREST |
Jury : | Président / Présidente : Jalal Fadili |
Examinateurs / Examinatrices : Salima El Kolei, Erwan Le Pennec | |
Rapporteurs / Rapporteuses : Pierre Borgnat, David Shuman |
Mots clés
Résumé
Au cours de la dernière décennie, le traitement du signal sur graphe est devenu un domaine de recherche très actif. Plus précisément, le nombre d’applications utilisant des repères construits à partir de graphes, tels que les ondelettes sur graphe, a augmenté de manière significative. Nous considérons en particulier le débruitage de signaux sur graphes au moyen d’une décomposition dans un repère ajusté d’ondelettes. Cette approche est basée sur le seuillage des coefficients d’ondelettes à l’aide de l’estimateur sans biais du risque de Stein (SURE). Nous étendons cette méthodologie aux graphes de grande taille en utilisant l’approximation par polynômes de Chebyshev qui permet d’éviter la décomposition de la matrice laplacienne du graphe. La principale difficulté est le calcul de poids dans l’expression du SURE faisant apparaître un terme de covariance en raison de la nature surcomplète du repère d’ondelettes. Le calcul et le stockage de celui-ci est donc nécessaire et rédhibitoire à grande échelle. Pour estimer cette covariance, nous développons et analysons un estimateur de Monte-Carlo reposant sur la transformation rapide de signaux aléatoires. Cette nouvelle méthode de débruitage trouve une application naturelle en confidentialité différentielle dont l’objectif est de protéger les données sensibles utilisées par les algorithmes. Une évaluation expérimentale de ses performances est réalisée sur des graphes de taille variable à partir de données réelles et simulées.