Thèse soutenue

Méthode automatique d’annotations sémantiques et indexation de documents textuels pour l’extraction d’objets pédagogiques

FR  |  
EN
Auteur / Autrice : Boutheina Ben Ali
Direction : Jean-Pierre DesclèsRim Faiz
Type : Thèse de doctorat
Discipline(s) : Mathématiques, informatique appliquées aux sciences de l'homme
Date : Soutenance le 18/01/2014
Etablissement(s) : Paris 4 en cotutelle avec Université de Tunis (1958-1988)
Ecole(s) doctorale(s) : École doctorale Concepts et langages (Paris ; 2000-....)
Partenaire(s) de recherche : Equipe de recherche : Sens, texte, informatique, histoire (Paris ; 2010-....) - Langues, logiques, informatique, cognition (Paris)
Jury : Président / Présidente : Patrice Pognan
Examinateurs / Examinatrices : Jean-Pierre Desclès, Rim Faiz, Lamia Hadrich Belguith

Résumé

FR  |  
EN

L'analyse du contenu devient une nécessité pour l'accès et l'utilisation de l'information en particulier dans le domaine de la didactique des disciplines. Nous proposons un système SRIDOP d'annotations sémantiques et d'indexation des documents pédagogiques à partir des annotations, en se basant sur la méthode d'Exploration Contextuelle qui, à un identificateur linguistique d'un concept, associe une annotation d'un segment en tenant compte d'indices contextuels gérés par des règles. SRIDOP est composé de quatre modules consécutifs : (1)Segmentation automatique des documents en paragraphes et phrases ; (2) annotation selon différents points de vue de fouille (exemple: identification de définitions, exemples, exercices, etc.) en se basant sur une ontologie linguistique de concepts associés à un point de vue de fouille (carte sémantique) et de ressources linguistiques (indicateurs de concepts, indices linguistiques et règles d'Exploration Contextuelle) ; (3) extraction d'objets pédagogiques ; (4) constitution de fiches pédagogiques exploitables par les utilisateurs. SRIDOP est évalué et comparé à d'autres systèmes.