Neural audio synthesis of realistic piano performances

Lenny Renault

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Synthèse audio neuronale de performances réalistes de piano

FR |

EN

Auteur / Autrice :	Lenny Renault
Direction :	Axel Roebel, Rémi Mignot
Type :	Thèse de doctorat
Discipline(s) :	Sciences et technologies de l'information et de la communication
Date :	Soutenance le 08/07/2024
Etablissement(s) :	Sorbonne université
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche :	Laboratoire : Sciences et technologies de la musique et du son (Paris ; 1983-....)
Jury :	Président / Présidente : Gaël Richard
	Examinateurs / Examinatrices : Jesse Engel, Juliette Chabassier
	Rapporteurs / Rapporteuses : Mark Sandler, Mathieu Lagrange

Mots clés

FR |

EN

Mots clés contrôlés

Effets sonores

Apprentissage profond

Traitement du signal

Mots clés libres

Apprentissage profond

Musique informatique

Synthèse audio

Extraction d'informations musicales

Synthèse de performance

Musique symbolique

Résumé

FR |

EN

Musicien et instrument forment un duo central de l'expérience musicale.Indissociables, ils sont les acteurs de la performance musicale, transformant une composition en une expérience auditive émotionnelle. Pour cela, l'instrument est un objet sonore que le musicien contrôle pour retranscrire et partager sa compréhension d'une œuvre musicale. Accéder aux sonorités d'un tel instrument, souvent issus de facture poussée, et à sa maîtrise de jeu, requiert des ressources limitant l'exploration créative des compositeurs. Cette thèse explore l'utilisation des réseaux de neurones profonds pour reproduire les subtilités introduites par le jeu du musicien et par le son de l'instrument, rendant la musique réaliste et vivante. En se focalisant sur la musique pour piano, le travail réalisé a donné lieu à un modèle de synthèse sonore pour piano ainsi qu'à un modèle de rendu de performances expressives. DDSP-Piano, le modèle de synthèse de piano, est construit sur l'approche hybride de Traitement du Signal Différentiable (DDSP) permettant d'inclure des outils de traitement du signal traditionnel dans un modèle d'apprentissage profond. Le modèle prend des performances symboliques en entrée, et inclut explicitement des connaissance spécifiques à l'instrument, telles que l'inharmonicité, l'accordage et la polyphonie. Cette approche modulaire, légère et interprétable synthétise des sons d'une qualité réaliste tout en séparant les différents éléments constituant le son du piano. Quant au modèle de rendu de performance, l'approche proposée permet de transformer des compositions MIDI en interprétations expressives symboliques. En particulier, grâce à un entraînement adverse non-supervisé, elle dénote des travaux précédents en ne s'appuyant pas sur des paires de partitions et d'interprétations alignées pour reproduire des qualités expressives. La combinaison des deux modèles de synthèse sonore et de rendu de performance permettrait de synthétiser des interprétations expressives audio de partitions, tout en donnant la possibilité de modifier, dans le domaine symbolique, l'interprétation générée.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Synthèse audio neuronale de performances réalistes de piano

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Synthèse audio neuronale de performances réalistes de piano

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses