Modèles de déformation de processus stochastiques généralisés : application à l'estimation des non-stationnarités dans les signaux audio
Auteur / Autrice : | Harold Omer |
Direction : | Bruno Torrésani |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 18/06/2015 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | Ecole doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....) |
Jury : | Président / Présidente : Patrick Flandrin |
Examinateurs / Examinatrices : Frédéric Richard, Richard Kronland-Martinet | |
Rapporteurs / Rapporteuses : Roland Badeau, Valérie Perrier |
Mots clés
Mots clés contrôlés
Résumé
Ce manuscrit porte sur la modélisation et l'estimation de certaines non-stationnarités dans les signaux audio. Nous nous intéressons particulièrement à une classe de modèles de sons que nous nommons timbre*dynamique dans lesquels un signal stationnaire, associé au phénomène physique à l'origine du son, est déformé au cours du temps par un opérateur linéaire unitaire, appelé opérateur de déformation, associé à l'évolution temporelle des caractéristiques de ce phénomène physique. Les signaux audio sont modélisés comme des processus gaussiens généralisés et nous donnons dans un premier temps un ensemble d'outils mathématiques qui étendent certaines notions utilisées en traitement du signal au cas des processus stochastiques généralisés.Nous introduisons ensuite les opérateurs de déformations étudiés dans ce manuscrit. L'opérateur de modulation fréquentielle qui est l'opérateur de multiplication par une fonction à valeurs complexes de module unité, et l'opérateur de changement d'horloge qui est la version unitaire de l'opérateur de composition.Lorsque ces opérateurs agissent sur des processus stationnaires les processus déformés possèdent localement des propriétés de stationnarité et les opérateurs de déformation peuvent être approximés par des opérateurs de translation dans les plans temps-fréquence et temps-échelle. Nous donnons alors des bornes pour les erreurs d'approximation correspondantes. Nous développons ensuite un estimateur de maximum de vraisemblance approché des fonctions de dilatation et de modulation. L'algorithme proposé est testé et validé sur des signaux synthétiques et des sons naurels.