Thèse soutenue

Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques

FR  |  
EN
Auteur / Autrice : Odile Mella
Direction : Marie-Christine Haton
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1993
Etablissement(s) : Nancy 1
Partenaire(s) de recherche : autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques

Résumé

FR

Les recherches en reconnaissance automatique du locuteur peuvent être reparties en deux grandes classes, d'une part les recherches qui sont fondées sur les techniques de reconnaissance de formes issues de la reconnaissance automatique de la parole, et d'autre part, celles qui ont pour objectif d'exploiter explicitement la variabilité interlocuteur et la variabilité intralocuteur de la parole. Notre étude se situe dans cette seconde classe. Dans un premier temps, nous présentons les connaissances des domaines de la production de la parole et de la variabilité de la parole qui sont nécessaires à la compréhension de la problématique de la caractérisation du locuteur. Puis, nous plaçons notre travail dans le cadre plus général de la reconnaissance automatique du locuteur en présentant une synthèse des travaux les plus récents dans les deux classes de recherches définies au début de ce résumé. Enfin, nous développons les différentes étapes de notre étude. Apres une présentation des paramètres acoustiques et phonétiques sélectionnés comme susceptibles de caractériser au mieux le locuteur, nous décrivons les phases d'élaboration et d'étiquetage manuel de notre corpus. Puis, nous détaillons l'étude de la pertinence des trois premiers formants de sept voyelles orales dans un contexte /p-voyelle-r/. Pour cela, nous exposons une méthodologie de détermination automatique de valeurs robustes des trois premiers formants des voyelles et nous commentons les résultats obtenus. Ensuite, nous présentons, pour chacun des triplets sélectionnés, l'analyse de la pertinence des combinaisons de formants et des écarts entre les formants pour l'identification du locuteur. Cette analyse est fondée sur l'établissement de trois indicateurs issus d'expériences d'identification d'un locuteur parmi dix. Nous terminons par une interprétation de ces résultats.