Thèse soutenue

Analyse de données massives en temps réel pour l’extraction d’informations sémantiques et émotionnelles de la parole

FR  |  
EN
Auteur / Autrice : Manon Macary
Direction : Yannick Estève
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 24/06/2022
Etablissement(s) : Le Mans
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de l'Université du Mans - Laboratoire d'Informatique de l'Université du Mans / LIUM
Jury : Examinateurs / Examinatrices : Marie Tahon, Fabien Ringeval, Damien Lolive
Rapporteur / Rapporteuse : Martine Adda-Decker, Denis Jouvet

Résumé

FR  |  
EN

Les centres d'appels reçoivent tous les jours des milliers de coups de téléphone permettant de faire le lien entre des clients et des conseillers. Ainsi, de nombreuses informations peuvent être extraites de ces conversations, dont l'aspect émotionnel.Cette thèse CIFRE a été réalisée en collaboration avec l’entreprise Allo-Media qui est spécialisée dans l'analyse automatique de conversations téléphoniques de centre d'appels. Concrètement, elle met en place des relevés d'information sur différents aspects de la conversation en indexant ces informations pour permettre un traitement automatique des données. L’entreprise cherche à enrichir ses annotations avec une solution innovante permettant de rajouter un aspect émotionnel en adéquation avec le contexte de la relation clientèle afin d'alerter sur les points saillants de la conversation.Cette thèse tente donc de répondre à plusieurs problématiques : (i) tout d'abord la définition de l'émotion de satisfaction et de frustration dans la parole, (ii) la mise en place d'une reconnaissance automatique de ces émotions de façon continue tout au long de la conversation et (iii) des méthodes d'évaluation de ces systèmes automatiques.Les contributions de cette thèse sont : (i) la construction d’un corpus à partir de données réelles, annoté de façon continue en satisfaction et frustration, (ii) la mise en place de différentes stratégies pour construire un système de reconnaissance automatique utilisant des réseaux de neurones profonds en nous comparant à l'état de l'art, (iii) l’exploration de la dissociation des aspects acoustique et linguistique des conversations afin d'améliorer nos systèmes de reconnaissance et enfin (iv) la mise en place d’une évaluation nuancée de ces systèmes.