Thèse soutenue

Détection automatique de ruptures dans le signal de parole : apport de la modélisation adaptative

FR  |  
EN
Auteur / Autrice : Nour-Edine Achab
Direction : Gang Feng
Type : Thèse de doctorat
Discipline(s) : Signal, image, parole
Date : Soutenance en 1994
Etablissement(s) : Grenoble INPG
Partenaire(s) de recherche : Laboratoire : Institut de la communication parlée (Grenoble1983-2007)
Jury : Président / Présidente : Geneviève Jourdain
Examinateurs / Examinatrices : Louis-Jean Boë
Rapporteurs / Rapporteuses : Régine André-Obrecht, Laurent Miclet

Résumé

FR

Le probleme de la detection automatique de ruptures dans le signal de parole, en vue de sa segmentation, est traite dans cette these. Nous avons adopte la methode proposee dans un cadre general de traitement de signal par michele basseville et adaptee a la parole par regine andre-obrecht. Le test statistique utilise dans cette methode est dissymetrique, ce qui engendre des omissions de detection de frontieres phonetiques et peut-etre penalisant dans certaines applications comme la reconnaissance de la parole ou encore l'etiquetage des bases de donnees de sons. Une solution a deja ete apportee a ce probleme: la methode forward-backward qui consiste a traiter temporellement le signal dans les deux sens, direct et inverse, par la methode de divergence. Elle est tres efficace mais ne peut etre envisagee pour des applications necessitant un traitement en ligne. Pour depasser cette limite nous proposons une nouvelle solution basee sur la modelisation adaptative du signal acoustique. Deux detecteurs de ruptures bases sur ce type de modelisation - l'un utilisant le test de divergence et l'autre le test de vraisemblance - sont developpes. Les resultats obtenus sur un corpus de logatomes et de signaux de parole continue sont satisfaisants et en bonne concordance avec des evenements reperes manuellement par un expert phoneticien. Ils sont egalement comparables a ceux obtenus avec la methode forward-backward sans toutefois qu'il ne soit necessaire de traiter le signal dans le sens retrograde. Cette solution permet d'envisager leur application au codage, a l'etiquetage, et a la reconnaissance automatique de la parole