Thèse soutenue

Changements syntaxiques dans le Yorùbá de la presse (1930-2010) : traitement automatique d'un corpus diachronique et analyse des résultats

FR  |  
EN
Auteur / Autrice : Nicolas, Christophe Aubry
Direction : Konstantin Igorevič Pozdnâkov
Type : Thèse de doctorat
Discipline(s) : Langues, littératures et sociétés du monde
Date : Soutenance en 2010
Etablissement(s) : Paris, INALCO

Mots clés

FR

Résumé

FR  |  
EN

Nous effectuons un traitement automatique, avec un étiqueteur morphosyntaxique, d'un corpus diachronique de 400 000 mots constitué de journaux en langue yorùbá (Nigeria) publiés entre les années 1930 et les années 2000, saisi et standardisé manuellement. Les résultats de cet étiquetage servent dans un deuxième temps de données à une analyse des changements syntaxiques intervenus au cours de cette période. L'accent est mis sur les phénomènes de grammaticalisation et les constructions verbales sérielles. Le chapitre 1 présente le yorùbá dans le cadre théorique de la Grammaire Lexicale Fonctionnelle (Lexical Functional Grammar, LFG) et décrit l'outil d'étiquetage. Le chapitre 2 présente la presse yorùbá d'un point de vue historique, décrit le corpus et sa standardisation et se clôt sur une étude succinte du vocabulaire de la presse. Le chapitre 3 présente les changements syntaxiques découverts