Thèse soutenue

Études linguistiques et phonétiques du code-switching français-arabe : analyses de grands corpus et traitement automatique de la parole

FR  |  
EN
Auteur / Autrice : Djegdjiga Amazouz
Direction : Martine Adda-Decker
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 03/12/2019
Etablissement(s) : Paris 3
Ecole(s) doctorale(s) : École doctorale Langage et langues (Paris)
Partenaire(s) de recherche : Laboratoire : Laboratoire de phonétique et phonologie (Paris)
Jury : Président / Présidente : Rachid Ridouane
Examinateurs / Examinatrices : Martine Adda-Decker, Rachid Ridouane, Rudolph Sock, Kamel Smaïli, Barbara Bullock-Wilson, Lori Lamel
Rapporteurs / Rapporteuses : Rudolph Sock, Kamel Smaïli

Résumé

FR  |  
EN

Cette thèse présente des recherches linguistiques et phonétiques sur le code-switching Français-Arabe Algérien. Un corpus de 7h30 de parole (5h de parole spontané et 2h30 de parole lue) a été constitué en enregistrant 20 hommes et femmes parlant le français et l'arabe algérien. Cette thèse présente également les méthodes de traitement des données orales du code-switching telles que la segmentation de la parole, la segmentation des énoncés de code-switching ainsi que la transcription du français et du dialecte arabe algérien. Cette thèse présente également des méthodes d'alignement automatique de ces données bilingues ainsi qu'un alignement combiné de deux alignements monolingues. Nous avons mené des expériences basées sur l'alignement automatique avec des variations qui traitent de la question de l'influence d'un système phonologique d'une langue A sur des productions phonétiques en code-switching du français et de l'arabe algérien. Nous avons d'abord abordé la variation en réalisant une étude sur la variation des voyelles, dans des productions en langue française et en arabe algérien. Nous avons aussi abordé les consonnes emphatiques et l'emphatisation des deux langues. Enfin, nous avons également travaillé sur les géminées et la gémination dans les productions langagières en code-switching. Les résultats ont montré que le code-switching FR-AA se caractérise par des changements de langues très courts qui sont un réel défi pour l’identification des langues dans le code-switching. Le code-switching a un impact sur la variation phonétique des voyelles et des consonnes. La parole du code-switching permet au locuteur de produire moins de variation de voyelles et de consonnes que la parole monolingue.