Approche hybride pour la reconnaissance automatique de la parole en langue arabe

Abir Masmoudi Dammak

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Approche hybride pour la reconnaissance automatique de la parole en langue arabe

FR |

EN

Auteur / Autrice :	Abir Masmoudi Dammak
Direction :	Lamia Hadrich Belguith, Yannick Estève
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 21/09/2016
Etablissement(s) :	Le Mans en cotutelle avec Université de Sfax (Tunisie)
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique de l'Université du Mans - Laboratoire d'Informatique de l'Université du Mans / LIUM

Mots clés

FR |

EN

Mots clés contrôlés

Phonétique

Son -- Enregistrement et reproduction

Corpus (recherche)

Prononciation

Arabe tunisien (dialecte)

Reconnaissance automatique de la parole

Mots clés libres

Reconnaissance de la parole

Langue Arabe

Dialecte tunisien

Dictionnaire phonétique

Résumé

FR |

EN

Le développement d'un système de reconnaissance de la parole exige la disponibilité d'une grande quantité de ressources à savoir, grands corpus de texte et de parole, un dictionnaire de prononciation. Néanmoins, ces ressources ne sont pas disponibles directement pour des dialectes arabes. De ce fait, le développement d'un SRAP pour les dialectes arabes se heurte à de multiples difficultés à savoir, l’'abence de grandes quantités de ressources et l'absence d’'une orthographe standard vu que ces dialectes sont parlés et non écrit. Dans cette perspective, les travaux de cette thèse s’intègrent dans le cadre du développement d’un SRAP pour le dialecte tunisien. Une première partie des contributions consiste à développer une variante de CODA (Conventional Orthography for Arabic Dialectal) pour le dialecte tunisien. En fait, cette convention est conçue dans le but de fournir une description détaillée des directives appliquées au dialecte tunisien. Compte tenu des lignes directives de CODA, nous avons constitué notre corpus nommé TARIC : Corpus de l’interaction des chemins de fer de l’arabe tunisien dans le domaine de la SNCFT. Outre ces ressources, le dictionnaire de prononciation s’impose d’une manière indispensable pour le développement d’un SRAP. À ce propos, dans la deuxième partie des contributions, nous visons la création d’un système nommé conversion (Graphème-Phonème) G2P qui permet de générer automatiquement ce dictionnaire phonétique. Toutes ces ressources décrites avant sont utilisées pour adapter un SRAP pour le MSA du laboratoire LIUM au dialecte tunisien dans le domaine de la SNCFT. L’évaluation de notre système donné lieu WER de 22,6% sur l’ensemble de test.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Approche hybride pour la reconnaissance automatique de la parole en langue arabe

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Approche hybride pour la reconnaissance automatique de la parole en langue arabe

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses