Thèse soutenue

Prediction of structured opinion outputs : theoretical and methodological aspects

FR  |  
EN
Auteur / Autrice : Alexandre Garcia
Direction : Florence D'Alché-Buc
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 18/11/2019
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement de préparation de la thèse : Télécom Paris (Palaiseau, Essonne ; 1878-....)
Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....)
Jury : Président / Présidente : Alexandre Allauzen
Examinateurs / Examinatrices : Alessandro Rudi, Aurélien Bellet, Slim Essid, Chloé Clavel
Rapporteurs / Rapporteuses : Thierry Artières, Massimiliano Pontil

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La recrudescence de contenus dans lesquels les clients expriment leurs opinions relativement à des produits de consommation a fait de l'analyse d'opinion un sujet d'intérêt pour la recherche en apprentissage automatique. Cependant, prédire une opinion est un tâche difficile et parmi les modèles à disposition, peu sont capables de capturer la complexité de tels objets. Les approches actuelles reposent sur la prédiction de représentations simplifiées d'expressions affectives. Par exemple, il est possible de se restreindre à la reconnaissance de l'attribut de valence. Cette thèse propose d'étudier le problème de la construction de modèles structurés capables de tirer parti des dépendances entre les différentes composantes des opinions. Dans ce contexte, le choix d'un modèle d'opinion a des conséquences sur la complexité du problème d'apprentissage et sur les propriétés statistiques des fonctions de prédiction associées. Nous étudions 2 problèmes classique de l'analyse d'opinion pour lesquels nous mettons en oeuvre des modèles à base de fonctions à noyau de sortie permettant d'illustrer le compromis précision-complexité de la procédure d'apprentissage. Un second aspect de cette thèse repose sur l'adaptation de méthodes issues de l'état de l'art à un jeu de données comportant des données d'opinion à la structure complexe. Nous proposons une approche basée sur l'apprentissage profond pour prendre en contre jointement les différentes étiquettes du modèle d'opinions. Une nouvelle architecture hiérarchique est introduite issue de la fusion de structures précédemment proposées en les étendant à un jeu de données multimodal. Nous montrons que notre approche fournit des résultats compétitifs par rapport à des architectures traitant séparément les différentes représentations des opinions ce qui soulève des nouvelles questions concernant les stratégies optimales de traitement de données définies selon une hiérarchie .