Thèse soutenue

Désambiguïsation sémantique dans le cadre de la simplification lexicale : contributions à un système d'aide à la lecture pour des enfants dyslexiques et faibles lecteurs

FR  |  
EN
Auteur / Autrice : Mokhtar Boumedyen Billami
Direction : Nùria GalaJohannes Ziegler
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 15/11/2018
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École doctorale Cognition, Langage et Education (Aix-en-Provence ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d’Informatique et Systèmes (Marseille ; La Garde, Var ; 2018-….)
Jury : Président / Présidente : Laurent Prévot
Examinateurs / Examinatrices : Cécile Fabre
Rapporteur / Rapporteuse : Olivier Ferret, Mathieu Lafourcade

Résumé

FR  |  
EN

Ces dernières années, un nombre important de technologies ont été créées pour venir en aide aux personnes ayant des difficultés pour lire des textes écrits. Les systèmes proposés intègrent des technologies de la parole (lecture à « voix haute ») ou des aides visuelles (paramétrage et/ou mise en couleur des polices ou augmentation de l’espace entre lettres et lignes). Cependant, il est essentiel de proposer aussi des transformations sur le contenu afin d’avoir des substituts de mots plus simples et plus fréquents. Le but de cette thèse est de contribuer à un système d’aide à la lecture permettant de proposer automatiquement une version simplifiée d’un texte donné tout en gardant le même sens des mots.Le travail présenté adresse le problème de l’ambiguïté sémantique (très courant en traitement automatique des langues) et vise à proposer des solutions pour la désambiguïsation sémantique à l’aide de méthodes non supervisées et à base de connaissances provenant de ressources lexico-sémantiques. Dans un premier temps, nous proposons un état de l’art sur les méthodes de désambiguïsation sémantique et les mesures de similarité sémantique (essentielles pour la désambiguïsation sémantique). Par la suite, nous comparons divers algorithmes de désambiguïsation sémantique afin d’en tirer le meilleur. Enfin, nous présentons nos contributions pour la création d’une ressource lexicale pour le français proposant des synonymes désambiguïsés et gradués en fonction de leur niveau de difficulté de lecture et compréhension. Nous montrons que cette ressource est utile et peut être intégrée dans un module de simplification lexicale de textes.