Modélisation et analyse de la parole : Contrôle d’un robot parlant via un modèle interne optimal basé sur les réseaux de neurones artificiels. Outils statistiques en analyse de la parole.
Auteur / Autrice : | Iaroslav Blagouchine |
Direction : | Éric Moreau, Salah Bourennane |
Type : | Thèse de doctorat |
Discipline(s) : | Optique, photonique et traitement d'image |
Date : | Soutenance le 22/03/2010 |
Etablissement(s) : | Aix-Marseille 2 |
Ecole(s) doctorale(s) : | École Doctorale Physique et Sciences de la Matière (Marseille) |
Partenaire(s) de recherche : | Établissement d'enseignement supérieur : École centrale de Marseille (2006-....) - Aix-Marseille Université (2012-....) |
Jury : | Président / Présidente : Michel Paindavoine |
Examinateurs / Examinatrices : Sylvain Maire | |
Rapporteurs / Rapporteuses : Jean–Christophe Pesquet, Yannick Deville |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse de doctorat traite les aspects de la modélisation et de l'analyse de la parole, regroupés sous le chapeau commun de la qualité. Le premier aspect est représenté par le développement d'un modèle interne de contrôle de la production de la parole ; le deuxième, par le développement des outils pour son analyse. Un modèle interne optimal sous contraintes est proposé pour le contrôle d'un robot parlant, basé sur l'hypothèse du point d'équilibre (EPH, modèle-lambda). Ce modèle interne se repose sur le principe suivant : les mouvements du robot sont produits de telle façon que la longueur du chemin, parcouru dans l'espace interne des commandes motrices lambda, soit minimale, sous certaines contraintes liées à l'espace externe. L'aspect mathématique du problème conduit au problème géodésique généralisé, un problème relevant du calcul variationnel, dont la solution exacte analytique est assez complexe. En utilisant certains résultats empiriques, une solution approximative est enfin développée et implémentée. La solution du problème donne des résultats intéressants et prometteurs, et montre que le modèle interne proposé permet d'atteindre une certaine réalité de la production de la parole ; notamment, des similitudes entre la parole réelle et celle produite par le robot sont constatées. Puis, dans un but d'analyser et de caractériser le signal de parole, plusieurs méthodes d'analyse statistique sont développées. Elles sont basées sur les statistiques d'ordre supérieurs et sur l'entropie discrète normalisée. Dans ce cadre, nous avons également élaboré un estimateur non-biaisée et efficace du cumulant d'ordre quatre, en deux versions bloc et adaptative.