Thèse soutenue

Construction de fiches de synthèse par annotation sémantique automatique des publications scientifiques : application aux articles en biologie

FR  |  
EN
Auteur / Autrice : Olfa Makkaoui
Direction : Jean-Pierre DesclèsChristophe Jouis
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique appliquées aux sciences de l’homme
Date : Soutenance le 17/01/2014
Etablissement(s) : Paris 4
Ecole(s) doctorale(s) : École doctorale Concepts et langages (Paris)
Partenaire(s) de recherche : Laboratoire : Sens, texte, informatique, histoire (Paris)
Equipe de recherche : Langues, logiques, informatique, cognition (Paris)
Jury : Président / Présidente : Mohamed Hassoun
Examinateurs / Examinatrices : Jean-Pierre Desclès, Christophe Jouis, Jean-Guy Meunier, Jean-Gabriel Ganascia, Ghassan Mourad

Résumé

FR  |  
EN

Les fiches de synthèse multi-documents sont considérées comme une représentation textuelle organisée et structurée des segments textuels. La construction de ces fiches repose sur l’annotation sémantique des publications scientifiques suivant un ensemble de catégories discursives qu’on appelle des points de vue de fouille (comme les hypothèses plausibles, les résultats, ou les conclusions,…). L’annotation sémantique est réalisée automatiquement par la méthode de l’Exploration Contextuelle. Il s’agit d’une méthode linguistique computationnelle, implémentée par un moteur d’annotation sémantique, qui repose sur un ensemble de marqueurs linguistiques associés à des points de vue de fouille. Afin de pouvoir expérimenter la pertinence des résultats de notre système, nous avons procédé à l’évaluation des annotations automatiques sur des textes en biologie. La notion des spéculations (hypothèses plausibles), particulièrement décrite dans ce travail, a été évaluée sur le corpus BioScope annoté manuellement pour les spéculations et les négations. Nous proposons une application informatique qui permet aux utilisateurs d’obtenir des fiches de synthèse organisées suivant des critères sémantiques paramétrables par l’utilisateur.