Spoofing-robust Automatic Speaker Verification : Architecture, Explainability and Joint Optimisation
Auteur / Autrice : | Wanying Ge |
Direction : | Nicholas W. D. Evans, Massimiliano Todisco |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de l'ingénieur |
Date : | Soutenance le 30/05/2024 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Institut EURECOM (Sophia-Antipolis, Alpes-Maritimes) |
Jury : | Président / Présidente : Marie Tahon |
Examinateurs / Examinatrices : Kong-Aik Lee, Chiara Galdi, Itshak Lapidot | |
Rapporteurs / Rapporteuses : Marie Tahon, Driss Matrouf |
Mots clés
Résumé
Cette thèse explore les systèmes de vérification automatique du locuteur (ASV) et leurs vulnérabilités aux attaques de spoofing, soulignant la nécessité de contre-mesures robustes contre le spoofing (CMs). Elle présente l'application de la recherche d'architecture différentiable partiellement connectée (PC-DARTS) pour optimiser les architectures de réseau pour la lutte contre l'usurpation de la voix, démontrant une performance compétitive et une meilleure généralisation contre les attaques non vues. En outre, il utilise SHapley Additive exPlanations (SHAP) pour analyser et visualiser l'impact des caractéristiques d'entrée individuelles sur les performances de détection, ce qui permet de mieux comprendre le comportement du système et les caractéristiques de l'attaque. Enfin, il propose un système intégré de vérification du locuteur sensible à l'usurpation, en soulignant les avantages et les défis de l'optimisation conjointe de l'ASV et des CM pour améliorer les capacités de détection et la robustesse du système contre les attaques d'usurpation.