Thèse en cours

Prédiction de la Satisfaction Client à partir de Données Massives d'Appels Vocaux

FR  |  
EN
Auteur / Autrice : Yuxuan Zhang
Direction : Fabien Ringeval
Type : Projet de thèse
Discipline(s) : Mathématiques et Informatique
Date : Inscription en doctorat le 01/06/2024
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique de Grenoble
Equipe de recherche : GETALP - Groupe d'Etude en Traduction/Traitement des Langues et de la Parole (ancien labo Clips)

Résumé

FR  |  
EN

Une première étape de cette thèse consiste à réaliser un état de l'art des techniques existantes pour prédire la satisfaction client à partir de conversations téléphoniques. Cette étude sera suivie par un travail d'analyse statistique des données propriétaires d'Eloquant, dans l'objectif de construire un corpus d'apprentissage et d'évaluation de méthodes d'inférence. Une fois le corpus de données constitué, le travail consistera à modéliser la satisfaction client à partir des indices linguistiques et acoustiques présents dans les enregistrements. Les outils d'extraction d'informations langagières reposeront autant sur des approches statistiques (e.g., descripteurs prosodiques et probabilistes appliquées sur des items), que sur des grands modèles de langage, tels que BERT (DEVLIN et al., 2019) pour le texte et Whisper (RADFORD et al., 2022) ou Wav2Vec 2.0 (BAEVSKI et al., 2020) pour la parole, notamment pour la langue française (EVAIN et al., 2021a,b). Nous envisageons également l'ajustement (fine-tuning) de ces modèles sur les données propriétaires pour optimiser les performances. Les descripteurs utilisés seront exploités pour évaluer différentes approches d'inférence de la satisfaction client sur les données préalablement identifiées, avec des approches neuronales telles que des modèles récurrents à base d'attention (BAHDANAU et al., 2015). Une part importante du travail consistera également à évaluer la robustesse du système sur la tâche, notamment sur des instances non étiquetées via une tâche d'évaluation humaine.