Prédiction de la Satisfaction Client à partir de Données Massives d'Appels Vocaux
Auteur / Autrice : | Yuxuan Zhang |
Direction : | Fabien Ringeval |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques et Informatique |
Date : | Inscription en doctorat le 01/06/2024 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique de Grenoble |
Equipe de recherche : GETALP - Groupe d'Etude en Traduction/Traitement des Langues et de la Parole (ancien labo Clips) |
Mots clés
Résumé
Une première étape de cette thèse consiste à réaliser un état de l'art des techniques existantes pour prédire la satisfaction client à partir de conversations téléphoniques. Cette étude sera suivie par un travail d'analyse statistique des données propriétaires d'Eloquant, dans l'objectif de construire un corpus d'apprentissage et d'évaluation de méthodes d'inférence. Une fois le corpus de données constitué, le travail consistera à modéliser la satisfaction client à partir des indices linguistiques et acoustiques présents dans les enregistrements. Les outils d'extraction d'informations langagières reposeront autant sur des approches statistiques (e.g., descripteurs prosodiques et probabilistes appliquées sur des items), que sur des grands modèles de langage, tels que BERT (DEVLIN et al., 2019) pour le texte et Whisper (RADFORD et al., 2022) ou Wav2Vec 2.0 (BAEVSKI et al., 2020) pour la parole, notamment pour la langue française (EVAIN et al., 2021a,b). Nous envisageons également l'ajustement (fine-tuning) de ces modèles sur les données propriétaires pour optimiser les performances. Les descripteurs utilisés seront exploités pour évaluer différentes approches d'inférence de la satisfaction client sur les données préalablement identifiées, avec des approches neuronales telles que des modèles récurrents à base d'attention (BAHDANAU et al., 2015). Une part importante du travail consistera également à évaluer la robustesse du système sur la tâche, notamment sur des instances non étiquetées via une tâche d'évaluation humaine.