Thèse soutenue

C3i : système de reconnaissance vocale du chinois moderne

FR  |  
EN
Auteur / Autrice : Pierre Martin
Direction : Moncef Mlouka
Type : Thèse de doctorat
Discipline(s) : Sciences pour l'ingénieur
Date : Soutenance en 1994
Etablissement(s) : Nice
Partenaire(s) de recherche : Autre partenaire : Université de Nice-Sophia Antipolis. Faculté des sciences
Jury : Président / Présidente : Julien Borgnino
Examinateurs / Examinatrices : Harouna Kabre
Rapporteur / Rapporteuse : Jean Caelen, Henri Méloni

Résumé

FR

Le chinois moderne ou mandarin est une langue idéographique comptant près de 6000 caractères. La nécessite d'un codage phonétique des caractères chinois a incité les linguistes de la Chine Populaire à concevoir le pinyin. Il s'agit d'un alphabet phonétique constitué des prononciations des idéogrammes. Cependant le symbole graphique n'interprète pas le symbole phonétique. Cet aspect a toujours posé des difficultés dans la conception des systèmes de saisie des caractères chinois. Afin de pallier à cet inconvénient, dans nos travaux, nous proposons un système de compréhension de la parole adapté à ce langage naturel. Les deux modules du système, à savoir le décodage acoustico-phonétique et l'analyseur linguistique ont été élaborés en fonction des spécificités de cette langue. L'approche experte utilisée dans le module de DAP, en l'occurrences les triplets phonétiques (un son en contexte) correspond à la structure particulière des syllabes de la forme consonne + voyelle + partie finale. Les sons en contexte correspondent aux voyelles centrales des pinyins. Pour pouvoir exploiter l'expertise phonétique, il est indispensable de disposer de bons détecteurs d'événements acoustiques. Le suivi des formants est le plus important d'entre eux car la partie centrale d'un triplet est exclusivement une voyelle. Le ton présent sur la syllabe est identifié à l'aide de l'allure de la fréquence du fondamental. Un treillis de syllabes phonétiques est le résultat du module de DAP. L'analyseur linguistique, qui de ce treillis, essaie de déterminer, dans un premier temps, une représentation lexicale (mots) puis une représentation syntaxique, éventuellement incomplète voir multiple, de la phrase de départ. Cependant, le chinois moderne manque de changements morphologiques. Il recourt à l'ordre des mots, à la fonction des mots dans la phrase et à l'emploi de mots vide pour exprimer les notions et les catégories grammaticales. Les analyseurs morpho-lexical et syntaxique ont été élaborés à partir de ces particularités. Une analyse sémantique permet de valider la phrase en levant les ambiguïtés syntaxiques