Thèse soutenue

Dictionnaire électronique des mots français à trait d'union : problèmes de lexicographie informatique

FR  |  
EN
Auteur / Autrice : Michel Mathieu-Colas
Direction : Gaston Gross
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance en 1993
Etablissement(s) : Paris 13

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Les mots a trait d'union representent une des principales difficultes de l'orthographe francaise, en meme temps qu'ils constituent un echantillon de choix pour l'etude linguistique de la composition : d'ou l'interet d'un recensement systematique, presente sous la forme d'un dictionnaire electronique. Chaque entree donne lieu a un codage formel et semantique : description morphotogique (type de composition, categorie grammaticale, flexion) ; particularites orthographiques (notation des variantes) ; informations semantiques (traits, domaines, classes d'objets et registres). Au total, plus de 17000 unites se trouvent ainsi decrites. Le format adopte permet une analyse precise des parametres en presence. La reflexion porte en particulier sur la morphologie, l'orthographe et la typologie (etude des formes de composition : plus de trois cents types repertories). Le dictionnaire est complete par un lecique de 1900 locutions impliquant un trait d'union (a la va-vite, boire du petit-lait, centre hospitalo-universitaire) et par une presentation des principaux modeles productifs regissant les neologismes et les creations libres. Au-dela des particularites liees au trait d'union, l'accent est mis, du point de vue methodologique, sur les modalites de representation de l'information lexicale dans un dictionnaire electronique : le degroupement des entrees permet de prendre en charge, a cote de la description morphologique des unites, leur caracterisation semantique (notamment les domaines et les ''classes d'objets''). Ce type d'information s'avere indispensable pour l'utilisation effective du dictionnaire dans des applications informatiques.