Thèse en cours

Séparation de sources et transformation audio par synthèse neuronale profonde et hybride

FR  |  
EN
Auteur / Autrice : Bernardo Torres
Direction : Gaël RichardGeoffroy Peeters
Type : Projet de thèse
Discipline(s) : Informatique, données, IA
Date : Inscription en doctorat le 01/02/2023
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : Laboratoire de Traitement et Communication de l'Information
Equipe de recherche : S2A - Statistique et Apprentissage

Résumé

FR  |  
EN

Cette thèse se concentre sur la recherche de la combinaison d'approches génératives et d'apprentissage profond hybride pour la transformation et la séparation audio. L'approche générative apporte la capacité de générer de nouveaux échantillons de données à partir de leur modèle, tandis que l'apprentissage profond hybride permet de coupler le traitement du signal avec l'apprentissage profond pour une meilleure efficacité et interprétabilité. L'objectif de la séparation et de la transformation des sources musicales peut alors être envisagé à travers un paradigme basé sur la synthèse (au lieu du filtrage), dans lequel chaque source est un modèle génératif appris distinct. Chaque source peut être modifiée indépendamment pour effectuer une transformation audio. Une autre direction importante pour la thèse est la recherche de nouvelles métriques sonores pour quantifier les caractéristiques perceptuelles telles que la fidélité du timbre, l'identifiabilité du chanteur ou la conformité de l'harmonie.