Simulation en temps réel d'effets audio non-linéaires par intelligence artificielle
Auteur / Autrice : | Tara Vanhatalo |
Direction : | Myriam Desainte-Catherine, Pierrick Legrand |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées et calcul scientifique |
Date : | Soutenance le 29/04/2024 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Institut de mathématiques de Bordeaux |
Jury : | Président / Présidente : Louis Bigo |
Examinateurs / Examinatrices : Juliette Chabassier, Emilia Gómez Gutiérrez, Pierre Hanna | |
Rapporteurs / Rapporteuses : Isabel Barbancho Pérez, Joshua Reiss |
Résumé
Certains produits du domaine de la technologie musicale présentent des caractéristiques sonores uniques et recherchées par les musiciens. Ces caractéristiques sont souvent dues aux non-linéarités de leurs circuits électroniques. Nous cherchons à préserver le son de ces appareils par le biais de simulations numériques et à les rendre largement accessibles à de nombreux musiciens. Ce domaine d’étude a connu une forte augmentation de l’utilisation des réseaux de neurones pour la simulation au cours des dernières années. Dans ce travail, nous proposons d’utiliser les réseaux neuronaux pour cette tâche. En particulier, nous nous concentrons sur les méthodes de boîte noire capables de fonctionner en temps réel pour la modélisation des effets non linéaires, tout en gardant les contraintes du guitariste à l’esprit. Nous couvrons l’état actuel des connaissances et identifions les domaines qui méritent d’être améliorés ou étudiés, avec pour objectif final le développement d’un produit. La première étape, qui consiste à identifier les architectures capables de traiter en temps réel et en continu, est suivie par l’augmentation et l’amélioration de ces architectures et de leur pipeline d’apprentissage grâce à un certain nombre de méthodes. Ces méthodes comprennent l’intégration continue avec des tests unitaires, l’optimisation automatique des hyperparamètres et l’utilisation de l’apprentissage par transfert. Un prototype en temps réel utilisant un backend C++ personnalisé est créé à l’aide de ces méthodes. Une étude sur l’anticrénelage en temps réel pour les modèles boîte noire est présentée, car il a été constaté que ces réseaux présentent de grandes quantités de distorsion d’anticrénelage. Le travail sur l’incorporation du contrôle de l’utilisateur a également commencé pour une simulation complète des systèmes analogiques. Cela permet à l’utilisateur final de disposer d’une gamme complète de possibilités de modification de la tonalité. Les performances des approches présentées sont évaluées de manière objective et subjective. Enfin, un certain nombre d’orientations possibles pour les travaux futurs sont également présentées.