Caractérisation et identification d'accents étrangers en français
Auteur / Autrice : | Bianca Vieru-Dimulescu |
Direction : | Martine Adda-Decker, Philippe Boula de Mareüil |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2008 |
Etablissement(s) : | Paris 11 |
Partenaire(s) de recherche : | Autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) |
Mots clés
Résumé
Cette thèse a pour sujet la caractérisation et l’identification des accents étrangers en français. Combien d’accents un natif français peut-il reconnaître et quels sont les indices qu’il utilise ? Notre intérêt se porte sur les productions en français de locuteurs anglais, allemand, arabes, espagnols, italiens et portugais, également comparés avec des natifs du français. L’objectif est d’identifier grâce au traitement automatique de la parole les indices acoustiques les plus fiables pour distinguer entre les accents et mettre en relation ces indices avec la perception humaine. Nous avons mesuré des paramètres acoustiques tels que la durée et le taux de voisement pour les consonnes, les valeurs des deux premiers formants pour les voyelles, le nombre de e muets réalisés, l’allongement de la voyelle précédant un e muet, le différence de fréquence fondamentale entre la voyelle pénultième et le e muet final, ainsi que les taux de confusions obtenus lors des alignements automatiques avec variantes de prononciation non standard. Des techniques d’apprentissage automatique ont été utilisées pour sélectionner les traits les plus discriminants afin de différencier entre les différents accents. Les résultats d’identification automatique pour la discrimination entre 7 origines linguistiques sont comparables avec les résultats obtenus lors de tests perceptifs. Autant lors des tests perceptifs qu’en identification automatique, les locuteurs français sont les mieux reconnus. Les traits spécifiques à chacun des accents étudiés peuvent être utilisées en reconnaissance automatique, dans la perspective de diminuer les taux d’erreurs.