Analyse, traitement et traduction des données linguistiques arabes hétérogènes
Auteur / Autrice : | Roya Almostafa |
Direction : | Salam Diab-duranton |
Type : | Projet de thèse |
Discipline(s) : | Etudes Arabes |
Date : | Inscription en doctorat le 23/11/2017 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale langues, littératures et sciences humaines |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles |
Mots clés
Résumé
Mon projet de thèse prolongera le travail commencé en master 2 (Traduction et Interpretation SIIMIL TRA). Il traitera des données en arabe dialectal appartenant aux parlers de Mashreq (la Syrie, le Liban, la Jordanie, la Palestine et l'Égypte), du Maghreb (la Tunisie) ainsi que les parlers saoudiens. Il se propose notamment d'étudier et de développer des modules d'analyse et de traitement de l'arabizi, très utilisé sur les réseaux sociaux et dans les communications informelles arabophones et bilingues. Mon thèse aura pour titre : L'analyse, le traitement et la traduction des données linguistiques arabes hétérogènes. Elle se présentera en trois parties. La première partie sera consacrée à l'observation et l'analyse du développement de la langue arabe ainsi que les effets historiques et socioculturels sur cette langue au Moyen-Orient et aux conditions qui ont permis l'apparition et l'évolution d'Arabizi. La deuxième partie traitera d'une manière approfondie l'ensemble des phénomènes qui peuvent apparaître dans le corpus traité et fera l'inventaire des problèmes et des difficultés qui existent dans ce genre de corpus, notamment ce qui a trait à la phonétique comme par exemple la transcription du ق que l'on rencontre transcrit soit comme Q, soit comme K ; afin de réaliser le but ultime de ce projet et de disposer des outils de transcription automatisés au maximum ce qui ne peut être simple avec tous ces problèmes de robustesse. Il y sera aussi question de l'étude de la structure lexicale des dialectes soumis à l'étude, dont l'objectif est de valoriser les ressources linguistiques issues de notre corpus. La troisième partie sera consacrée à la traduction vers le français de ce corpus conséquent, issu, comme déjà dit, d'une zone linguistique assez large.