Méthode automatique d’annotations sémantiques et indexation de documents textuels pour l’extraction d’objets pédagogiques
Auteur / Autrice : | Boutheina Ben Ali |
Direction : | Jean-Pierre Desclès, Rim Faiz |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques, informatique appliquées aux sciences de l'homme |
Date : | Soutenance le 18/01/2014 |
Etablissement(s) : | Paris 4 en cotutelle avec Université de Tunis (1958-1988) |
Ecole(s) doctorale(s) : | École doctorale Concepts et langages (Paris ; 2000-....) |
Partenaire(s) de recherche : | Equipe de recherche : Sens, texte, informatique, histoire (Paris ; 2010-....) - Langues, logiques, informatique, cognition (Paris) |
Jury : | Président / Présidente : Patrice Pognan |
Examinateurs / Examinatrices : Jean-Pierre Desclès, Rim Faiz, Lamia Hadrich Belguith |
Mots clés
Résumé
L'analyse du contenu devient une nécessité pour l'accès et l'utilisation de l'information en particulier dans le domaine de la didactique des disciplines. Nous proposons un système SRIDOP d'annotations sémantiques et d'indexation des documents pédagogiques à partir des annotations, en se basant sur la méthode d'Exploration Contextuelle qui, à un identificateur linguistique d'un concept, associe une annotation d'un segment en tenant compte d'indices contextuels gérés par des règles. SRIDOP est composé de quatre modules consécutifs : (1)Segmentation automatique des documents en paragraphes et phrases ; (2) annotation selon différents points de vue de fouille (exemple: identification de définitions, exemples, exercices, etc.) en se basant sur une ontologie linguistique de concepts associés à un point de vue de fouille (carte sémantique) et de ressources linguistiques (indicateurs de concepts, indices linguistiques et règles d'Exploration Contextuelle) ; (3) extraction d'objets pédagogiques ; (4) constitution de fiches pédagogiques exploitables par les utilisateurs. SRIDOP est évalué et comparé à d'autres systèmes.