Construction de fiches de synthèse par annotation sémantique automatique des publications scientifiques : application aux articles en biologie
Auteur / Autrice : | Olfa Makkaoui |
Direction : | Jean-Pierre Desclès, Christophe Jouis |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et informatique appliquées aux sciences de l’homme |
Date : | Soutenance le 17/01/2014 |
Etablissement(s) : | Paris 4 |
Ecole(s) doctorale(s) : | École doctorale Concepts et langages (Paris) |
Partenaire(s) de recherche : | Laboratoire : Sens, texte, informatique, histoire (Paris) |
Equipe de recherche : Langues, logiques, informatique, cognition (Paris) | |
Jury : | Président / Présidente : Mohamed Hassoun |
Examinateurs / Examinatrices : Jean-Pierre Desclès, Christophe Jouis, Jean-Guy Meunier, Jean-Gabriel Ganascia, Ghassan Mourad |
Mots clés
Résumé
Les fiches de synthèse multi-documents sont considérées comme une représentation textuelle organisée et structurée des segments textuels. La construction de ces fiches repose sur l’annotation sémantique des publications scientifiques suivant un ensemble de catégories discursives qu’on appelle des points de vue de fouille (comme les hypothèses plausibles, les résultats, ou les conclusions,…). L’annotation sémantique est réalisée automatiquement par la méthode de l’Exploration Contextuelle. Il s’agit d’une méthode linguistique computationnelle, implémentée par un moteur d’annotation sémantique, qui repose sur un ensemble de marqueurs linguistiques associés à des points de vue de fouille. Afin de pouvoir expérimenter la pertinence des résultats de notre système, nous avons procédé à l’évaluation des annotations automatiques sur des textes en biologie. La notion des spéculations (hypothèses plausibles), particulièrement décrite dans ce travail, a été évaluée sur le corpus BioScope annoté manuellement pour les spéculations et les négations. Nous proposons une application informatique qui permet aux utilisateurs d’obtenir des fiches de synthèse organisées suivant des critères sémantiques paramétrables par l’utilisateur.