Formalisation du vocabulaire et de la morphologie du persan : Construction de ressources linguistiques
Auteur / Autrice : | Marzieh Rabiei karahroudi |
Direction : | Max Silberztein, Amir Moghani |
Type : | Projet de thèse |
Discipline(s) : | Sciences du Langage, mention Traitement Automatique des Langues |
Date : | Inscription en doctorat le 19/09/2023 |
Etablissement(s) : | Besançon, Université Marie et Louis Pasteur |
Ecole(s) doctorale(s) : | École doctorale Lettres, Communication, Langues, Arts (Dijon ; Besançon ; 2017-....) |
Partenaire(s) de recherche : | Laboratoire : Centre de Recherches Interdisciplinaires et Transculturelles |
Equipe de recherche : TRAITEMENT AUTOMATIQUE DES LANGUES | |
établissement de préparation : Université de Franche-Comté (1971-....) |
Mots clés
Mots clés libres
Résumé
Résumé : Ce projet de thèse vise à construire une description formalisée du persan, une langue parlée par plus de 100 millions de locuteurs à travers le monde. L'objectif est de formaliser le vocabulaire, l'orthographe, la morphologie flexionnelle et dérivationnelle, la syntaxe et la grammaire transformationnelle du persan en utilisant la plateforme NooJ pour créer des ressources linguistiques robustes telles que des dictionnaires et des grammaires électroniques. Actuellement, il existe peu de ressources formalisées pour le persan, en particulier en comparaison avec d'autres langues comme le français. La problématique principale est de décrire l'orthographe du persan, qui utilise une variante de l'alphabet arabe malgré l'absence de liens apparentés avec l'arabe. De plus, des différences structurelles existent entre le persan et le français, notamment l'absence d'accord de genre et de nombre pour les adjectifs, ainsi que l'utilisation de pronoms non différenciés pour ''il/elle'' et ''ils/elles''. La méthodologie de ce projet comprend plusieurs étapes clés. Tout d'abord, la collecte du vocabulaire du persan, qui comprend les mots simples, les affixes (préfixes et suffixes), les mots composés et les expressions. Ensuite, la description de la morphologie flexionnelle et dérivationnelle, La syntaxe locale et en constituant et enfin des invariants sémantiques communs. Ce projet de thèse contribuera à combler le manque de ressources formalisées pour le persan, ce qui facilitera les études linguistiques et la recherche en traitement automatique des langues pour cette langue spécifique. Les résultats obtenus seront des ressources linguistiques précieuses pour les linguistes, les chercheurs et les développeurs travaillant sur la langue persane. En conclusion, ce projet de thèse vise à formaliser la langue persane en construisant des ressources linguistiques complètes. Cela permettra une meilleure compréhension et une analyse plus approfondie du persan, en contribuant à la recherche linguistique et au développement de technologies linguistiques pour cette langue importante et largement parlée.