Thèse soutenue

Détermination d'indices acoustiques robustes pour l'identification automatique des parlers arabes

FR
Auteur / Autrice : Mélissa Barkat
Direction : Jean-Marie Hombert
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance en 2000
Etablissement(s) : Lyon 2

Mots clés

FR

Résumé

FR

Ce travail de thèse a pour objectif la recherche d'indices acoustiques robustes en vue de l'identification automatique des parlers arabes par zones géographiques. Cette problématique est née de la volonté d'intégrer les recherches en dialectologie arabe au champ nouveau et prometteur de l'identification automatique des langues. Par le biais d'expériences perceptuelles, nous avons déterminé un faisceau d'indices discriminants permettant la distinction des parlers maghrébins vs. Orientaux. Parmi l'ensemble des traits dégagés, deux sont apparus comme étant a priori pertinents pour notre propos du fait de leur réalisation exclusive sur l'une ou l'autre des deux aires dialectales concernées. Il s'agit de la distribution des segments vocaliques et de la réalisation de l'opposition de durée vocalique. Différentes analyses acoustiques nous ont permis de caractériser la distribution des voyelles dans l'espace acoustique et d'établir une opposition pertinente entre les parlers maghrébins privilégiant la génération de voyelles centrales et les parlers orientaux préférant les positions périphériques. Du point de vue de la durée des segments vocaliques, notre étude révèle que l'opposition de durée est réalisée, en parole spontanée, dans des rapports comparables pour les parlers appartenant à une même zone géographique. En revanche, d'une zone dialectale à l'autre, les rapports mis en œuvre sont significativement différents, la tendance étant que les rapports voyelle longue/voyelle brève croissent d'Ouest en Est. La co-occurrence de ces deux critères de discrimination sur chacune des deux aires dialectales étudiées, nous a permis de les considérer comme potentiellement pertinents pour la discrimination automatique des parlers arabes par zone géographique. Nous avons ainsi mis en place des expériences d'identification automatique en utilisant un modèle de reconnaissance basé sur la détection automatique des voyelles et la modélisation statistique des systèmes vocaliques. Les résultats obtenus à l'issue de ces expériences valident la robustesse et la pertinence des deux critères de discrimination définis dans ce travail. En effet, nous montrons qu'il est possible de discriminer les parlers maghrébins des parlers orientaux sur la base des caractéristiques spectrales et quantitatives des segments vocaliques détectés automatiquement et nous obtenons entre 70 % et 90 % d'identification correcte en fonction du nombre de paramètres de modélisation retenus