Thèse soutenue

Caractérisation et identification d'accents étrangers en français

FR  |  
EN
Auteur / Autrice : Bianca Vieru-Dimulescu
Direction : Martine Adda-DeckerPhilippe Boula de Mareüil
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2008
Etablissement(s) : Paris 11
Partenaire(s) de recherche : Autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Résumé

FR  |  
EN

Cette thèse a pour sujet la caractérisation et l’identification des accents étrangers en français. Combien d’accents un natif français peut-il reconnaître et quels sont les indices qu’il utilise ? Notre intérêt se porte sur les productions en français de locuteurs anglais, allemand, arabes, espagnols, italiens et portugais, également comparés avec des natifs du français. L’objectif est d’identifier grâce au traitement automatique de la parole les indices acoustiques les plus fiables pour distinguer entre les accents et mettre en relation ces indices avec la perception humaine. Nous avons mesuré des paramètres acoustiques tels que la durée et le taux de voisement pour les consonnes, les valeurs des deux premiers formants pour les voyelles, le nombre de e muets réalisés, l’allongement de la voyelle précédant un e muet, le différence de fréquence fondamentale entre la voyelle pénultième et le e muet final, ainsi que les taux de confusions obtenus lors des alignements automatiques avec variantes de prononciation non standard. Des techniques d’apprentissage automatique ont été utilisées pour sélectionner les traits les plus discriminants afin de différencier entre les différents accents. Les résultats d’identification automatique pour la discrimination entre 7 origines linguistiques sont comparables avec les résultats obtenus lors de tests perceptifs. Autant lors des tests perceptifs qu’en identification automatique, les locuteurs français sont les mieux reconnus. Les traits spécifiques à chacun des accents étudiés peuvent être utilisées en reconnaissance automatique, dans la perspective de diminuer les taux d’erreurs.