Débruitage perceptuel de la parole

par Asmaa Amehraye

Thèse de doctorat en Sciences et technologies de l'information et de la communication

Sous la direction de Samir Saoudi.

Soutenue en 2009

à Télécom Bretagne .


  • Résumé

    Depuis une dizaine d’année, l’investigation des méthodes de débruitage de la parole a permis d’atteindre des résultats spectaculaires. Cependant, certaines problématiques et questions restent ouvertes. Une de ces problématiques est de parvenir à un compromis entre la réduction du bruit, la distorsion du signal et le bruit résiduel et musical. L’essor des méthodes basées sur des notions perceptuelles, essentiellement le phénomène de masquage fréquentiel, a suscité beaucoup d’intéret ces dernières décennies. L’objectif de base des filtres perceptuels est de réduire le bruit sans apporter plus de distorsion sur le signal de parole. L’une des façcons d´éviter des distorsions superflues est alors d’opérer uniquement dans les fréquences où le bruit est perceptuellement significatif. Cependant, en procédant ainsi, le bruit initialement inaudible, et par conséquent non pris en compte par le débruitage perceptuel, risque de devenir audible et genant si les masquants de ce bruit sont filtrés. C’est ce que l’on nomme dans cette thèse, le phénomène MAN (Maskee to Audible Noise). Les contributions majeures de cette thèse sont en premier lieu, de mettre en évidence ce phénomène qui, à notre connaissance, n’a jamais encore été décrit et de montrer ses effets secondaires. Ensuite, nous proposons une approche élémentaire pour remédier au phénomène MAN grace à un double filtrage atténuant le bruit dans toutes les fréquences pour éviter la production de ce phénomène. Nous proposons une deuxième approche basée sur un filtre optimal, dit anti-MAN, au sens d’un critère sélectif par zone de fréquence. A travers ce critère, nous définisssons la zone du phénomène MAN et pouvons ainsi atténuer le bruit y contribuant. Des évaluations comparatives sur des critères objectifs et subjectifs de qualité sont présentées pour plusieurs types de bruit et de rapport signal à bruit. Les résultats ont révélé la supériorité des méthodes proposées dans ce travail par rapport à des méthodes perceptuelles récentes ne considérant pas le phénomène MAN. Dans la suite expérimentale de ce travail, nous avons conçu deux systèmes de reconnaissance de la parole avec HTK (Hidden Markov Models) ; l’un est basé sur des monophones et l’autre sur des triphones. La phase d’apprentissage de ces deux systèmes s’est déroulée en absence du bruit ; ceci nous a permis d´évaluer l’impact du débruitage sur les performances de ces systèmes en présence de bruit. Les résultats montrent que les méthodes qui se distinguent par rapport à des critères objectifs et meme subjectifs ne sont pas forcément celles qui rendent les systèmes de reconnaissance plus robustes. Ces derniers sont généralement plus sensibles aux distorsions vu que le destinataire final est une machine.

  • Titre traduit

    Perceptual speech enhancement


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XXII-168 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. [161]-[169]

Où se trouve cette thèse\u00a0?

  • Bibliothèque : IMT Atlantique campus de Brest. Bibliothèque d'études.
  • Disponible pour le PEB
  • Cote : 7.213 AMEH

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2009TELB0072
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.