Thèse soutenue

Dictionnaire et grammaire pour le traitement automatique des ambiguïtés morphologiques des mots simples en français

FR  |  
EN
Auteur / Autrice : Zahra El Harouchy
Direction : Sylviane Cardey-Greenfield
Type : Thèse de doctorat
Discipline(s) : Sciences du langage, linguistique et informatique
Date : Inscription en doctorat le
Soutenance le 01/01/1997
Etablissement(s) : Besançon

Résumé

FR  |  
EN

En analyse automatique d'un texte, une des premières étapes consiste à déterminer les catégories grammaticales des mots. Pour ce faire ; un dictionnaire a été créé sur la base d'une reconnaissance de la ou des catégories grammaticales des mots simples à partir de leur terminaison. Ce dictionnaire que nous appelons dictionnaire automatique est un ensemble de règles générales (qui peuvent comprendre des sous-règles). Une règle générale énonce une terminaison. Un operateur (la ou les catégories grammaticales) est associé à chaque règle. Nous avons par exemple la règle générale suivante : ''les mots terminés par 'able' sont des adjectifs''. Comme exceptions (ou sous-règles) a cette règle générale, nous avons des noms (''cartable, …''), des verbes conjugués (''accable,. . . '') et des ambiguïtés morphologiques de type ''nom et verbe conjugué (comme ''sable table,. . . '') et des ambiguïtés de type ''nom et adjectif'' (comme comptable ,. . . ). Dès lors un tel dictionnaire met en évidence les mots possédant plusieurs catégories grammaticales. Lorsque le dictionnaire automatique détecte dans un texte un mot poly catégoriel, il y a renvoi à la grammaire qui se charge de lever les ambiguïtés morphologiques par un examen du contexte immédiat. Les règles de la grammaire fonctionnent comme un ensemble de combinaisons possibles d'éléments pouvant suivre et/ou précéder la forme ambigüe (par exemple une règle annonce qu'une forme ambigüe de type ''pronom ou article'' précédée de ''à cause de'' est alors un article).