Analyse à granularité fine de la subjectivité
Auteur / Autrice : | Matthieu Vernier |
Direction : | Béatrice Daille, Laura Monceaux |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2011 |
Etablissement(s) : | Nantes |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et mathématiques (Nantes) |
Partenaire(s) de recherche : | Autre partenaire : Université de Nantes. Faculté des sciences et des techniques |
Mots clés
Résumé
Avec l’essor du web social, les internautes sont davantage enclins à partager et affirmer leurs opinions. Devant l’ampleur du phénomène, les opinions exprimées sur internet sont devenues des données stratégiques qu’il faut pouvoir suivre en temps réel et caractériser finement. Notre démarche nous amène à recadrer le terme d’opinion dans les théories linguistiques sur la subjectivité et l’évaluation. Nous nous intéressons à délimiter automatiquement les passages subjectifs d’un texte et à en catégoriser plusieurs aspects sémantiques et énonciatifs : ont-ils une modalité logique ou axiologique ? quelle est leur polarité ? le locuteur dissimule t-il sa subjectivité ? quel est l’objet ciblé ? Notre première contribution pour aborder ces questions consiste en la distribution de deux ressources : le corpus Blogoscopie contient 5 900 passages évaluatifs et 6 900 objets annotés. Il est le premier corpus francophone de ce type ; le lexique de l’évaluation représente 4 000 mots ou expressions évaluatifs du français structurés gramaticalement et sémantiquement. À partir de ces ressources, nous proposons des méthodes pour résoudre trois problématiques liées à l’analyse de la subjectivité. La première méthode combine des caractéristiques lexicales, grammaticales et sémantiques pour délimiter et désambiguïser les évaluations d’un texte. Puis, nous évaluons deux méthodes s’appuyant sur des hypothèses sémantiques et morphologiques pour apprendre du vocabulaire évaluatif habituellement absent des ressources existantes. Enfin, nous expérimentons une nouvelle méthode, fondée sur la saillance d’un objet, améliorant l’existant sur la tâche d’identification de la cible d’une évaluation.