Études linguistiques et phonétiques du code-switching français-arabe : analyses de grands corpus et traitement automatique de la parole
Auteur / Autrice : | Djegdjiga Amazouz |
Direction : | Martine Adda-Decker |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 03/12/2019 |
Etablissement(s) : | Paris 3 |
Ecole(s) doctorale(s) : | École doctorale Langage et langues (Paris) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de phonétique et phonologie (Paris) |
Jury : | Président / Présidente : Rachid Ridouane |
Examinateurs / Examinatrices : Martine Adda-Decker, Rachid Ridouane, Rudolph Sock, Kamel Smaïli, Barbara Bullock-Wilson, Lori Lamel | |
Rapporteurs / Rapporteuses : Rudolph Sock, Kamel Smaïli |
Résumé
Cette thèse présente des recherches linguistiques et phonétiques sur le code-switching Français-Arabe Algérien. Un corpus de 7h30 de parole (5h de parole spontané et 2h30 de parole lue) a été constitué en enregistrant 20 hommes et femmes parlant le français et l'arabe algérien. Cette thèse présente également les méthodes de traitement des données orales du code-switching telles que la segmentation de la parole, la segmentation des énoncés de code-switching ainsi que la transcription du français et du dialecte arabe algérien. Cette thèse présente également des méthodes d'alignement automatique de ces données bilingues ainsi qu'un alignement combiné de deux alignements monolingues. Nous avons mené des expériences basées sur l'alignement automatique avec des variations qui traitent de la question de l'influence d'un système phonologique d'une langue A sur des productions phonétiques en code-switching du français et de l'arabe algérien. Nous avons d'abord abordé la variation en réalisant une étude sur la variation des voyelles, dans des productions en langue française et en arabe algérien. Nous avons aussi abordé les consonnes emphatiques et l'emphatisation des deux langues. Enfin, nous avons également travaillé sur les géminées et la gémination dans les productions langagières en code-switching. Les résultats ont montré que le code-switching FR-AA se caractérise par des changements de langues très courts qui sont un réel défi pour l’identification des langues dans le code-switching. Le code-switching a un impact sur la variation phonétique des voyelles et des consonnes. La parole du code-switching permet au locuteur de produire moins de variation de voyelles et de consonnes que la parole monolingue.