Thèse en cours

Formalisation du vocabulaire et de la morphologie du persan : Construction de ressources linguistiques

FR  |  
EN
Auteur / Autrice : Marzieh Rabiei karahroudi
Direction : Max SilberzteinAmir Moghani
Type : Projet de thèse
Discipline(s) : Sciences du Langage, mention Traitement Automatique des Langues
Date : Inscription en doctorat le 19/09/2023
Etablissement(s) : Besançon, Université Marie et Louis Pasteur
Ecole(s) doctorale(s) : École doctorale Lettres, Communication, Langues, Arts (Dijon ; Besançon ; 2017-....)
Partenaire(s) de recherche : Laboratoire : Centre de Recherches Interdisciplinaires et Transculturelles
Equipe de recherche : TRAITEMENT AUTOMATIQUE DES LANGUES
établissement de préparation : Université de Franche-Comté (1971-....)

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Résumé : Ce projet de thèse vise à construire une description formalisée du persan, une langue parlée par plus de 100 millions de locuteurs à travers le monde. L'objectif est de formaliser le vocabulaire, l'orthographe, la morphologie flexionnelle et dérivationnelle, la syntaxe et la grammaire transformationnelle du persan en utilisant la plateforme NooJ pour créer des ressources linguistiques robustes telles que des dictionnaires et des grammaires électroniques. Actuellement, il existe peu de ressources formalisées pour le persan, en particulier en comparaison avec d'autres langues comme le français. La problématique principale est de décrire l'orthographe du persan, qui utilise une variante de l'alphabet arabe malgré l'absence de liens apparentés avec l'arabe. De plus, des différences structurelles existent entre le persan et le français, notamment l'absence d'accord de genre et de nombre pour les adjectifs, ainsi que l'utilisation de pronoms non différenciés pour ''il/elle'' et ''ils/elles''. La méthodologie de ce projet comprend plusieurs étapes clés. Tout d'abord, la collecte du vocabulaire du persan, qui comprend les mots simples, les affixes (préfixes et suffixes), les mots composés et les expressions. Ensuite, la description de la morphologie flexionnelle et dérivationnelle, La syntaxe locale et en constituant et enfin des invariants sémantiques communs. Ce projet de thèse contribuera à combler le manque de ressources formalisées pour le persan, ce qui facilitera les études linguistiques et la recherche en traitement automatique des langues pour cette langue spécifique. Les résultats obtenus seront des ressources linguistiques précieuses pour les linguistes, les chercheurs et les développeurs travaillant sur la langue persane. En conclusion, ce projet de thèse vise à formaliser la langue persane en construisant des ressources linguistiques complètes. Cela permettra une meilleure compréhension et une analyse plus approfondie du persan, en contribuant à la recherche linguistique et au développement de technologies linguistiques pour cette langue importante et largement parlée.