Thèse soutenue

Analyse à granularité fine de la subjectivité

FR  |  
EN
Auteur / Autrice : Matthieu Vernier
Direction : Béatrice DailleLaura Monceaux
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2011
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : Autre partenaire : Université de Nantes. Faculté des sciences et des techniques

Résumé

FR  |  
EN

Avec l’essor du web social, les internautes sont davantage enclins à partager et affirmer leurs opinions. Devant l’ampleur du phénomène, les opinions exprimées sur internet sont devenues des données stratégiques qu’il faut pouvoir suivre en temps réel et caractériser finement. Notre démarche nous amène à recadrer le terme d’opinion dans les théories linguistiques sur la subjectivité et l’évaluation. Nous nous intéressons à délimiter automatiquement les passages subjectifs d’un texte et à en catégoriser plusieurs aspects sémantiques et énonciatifs : ont-ils une modalité logique ou axiologique ? quelle est leur polarité ? le locuteur dissimule t-il sa subjectivité ? quel est l’objet ciblé ? Notre première contribution pour aborder ces questions consiste en la distribution de deux ressources : le corpus Blogoscopie contient 5 900 passages évaluatifs et 6 900 objets annotés. Il est le premier corpus francophone de ce type ; le lexique de l’évaluation représente 4 000 mots ou expressions évaluatifs du français structurés gramaticalement et sémantiquement. À partir de ces ressources, nous proposons des méthodes pour résoudre trois problématiques liées à l’analyse de la subjectivité. La première méthode combine des caractéristiques lexicales, grammaticales et sémantiques pour délimiter et désambiguïser les évaluations d’un texte. Puis, nous évaluons deux méthodes s’appuyant sur des hypothèses sémantiques et morphologiques pour apprendre du vocabulaire évaluatif habituellement absent des ressources existantes. Enfin, nous expérimentons une nouvelle méthode, fondée sur la saillance d’un objet, améliorant l’existant sur la tâche d’identification de la cible d’une évaluation.