Thèse soutenue

Apprentissage incrémental en données : Application à la reconnaissance d'émotions personnalisée

FR  |  
EN
Auteur / Autrice : Jordan Gonzalez
Direction : Lionel PrévostAurélia Deshayes
Type : Thèse de doctorat
Discipline(s) : Informatique-traitement du signal
Date : Soutenance le 25/10/2022
Etablissement(s) : Paris, HESAM
Ecole(s) doctorale(s) : École doctorale Sciences des métiers de l'ingénieur (Paris)
Partenaire(s) de recherche : Laboratoire : Laboratoire Informatique et Société Numérique - Laboratoire Informatique et Société Numérique
établissement de préparation de la thèse : École nationale supérieure d'arts et métiers (1780-....)
Jury : Président / Présidente : Renaud Séguier
Examinateurs / Examinatrices : Lionel Prévost, Aurélia Deshayes, Éric Anquetil, Laurent Heutte, Simon Richir
Rapporteur / Rapporteuse : Éric Anquetil, Laurent Heutte

Résumé

FR  |  
EN

Le domaine de l'informatique affective, en plein essor depuis quelques décennies, a pour objectif de créer de nouveaux systèmes interactifs capables de percevoir l'état émotionnel de leurs interlocuteurs humains et de s'y adapter automatiquement.Il est de plus en plus fréquent que les datasets ne soient plus disponibles de manière complète et que les données arrivent au fur et à mesure, sans être forcément labélisées.De plus, bien que bon nombre de solutions aient été présentées pour caractériser de mieux en mieux les données, les performances des modèles pour la reconnaissance d’émotions demeurent souvent dépendantes de la variabilité individuelle chez les individus. En effet, certaines personnes sont susceptibles d'avoir des morphologies plus ou moins différentes selon l'âge, le genre, etc. D’autant plus que d’un point de vue comportemental, deux individus sont susceptibles d'exprimer un même état émotionnel différemment. Ces biais morphologiques et comportementaux sont réunis sous le terme de biais d'identité qui représente un des défis majeurs pour ce domaine.Les objectifs de cette thèse sont d’adapter automatiquement des modèles de textit{machine learning} aux traits morphologiques et comportementaux de l’individu afin de réduire le biais d'identité, et ainsi améliorer la reconnaissance de leurs états émotionnels.Pour cela, nous proposons d’appliquer l'apprentissage incrémental en données de modèles inspirés des forêts aléatoires afin de créer une méthode qui permette au modèle de s'adapter à différentes bases de données. L'une des principales caractéristiques des techniques incrémentales est la possibilité de mettre à jour les modèles en utilisant uniquement des données récentes. C'est souvent la seule solution pratique lorsqu'il s'agit d'apprendre des données ''à la volée'', car il serait impossible de garder en mémoire et de réapprendre à partir de zéro chaque fois que de nouvelles informations sont disponibles.Dans une première partie, nous présentons une analyse réalisée au début de la thèse sur les données du projet TEEC. Les données sont collectées à partir des interactions par visioconférence impliquant deux groupes d'apprenants effectuant des tâches d'apprentissage collaboratif à distance. Du fait qu'ils vivent dans deux pays différents, leurs représentations mentales sur divers thèmes sont différentes et produisent ce que nous appelons un effet de contexte ou conflit socio-cognitif. Nous étudions ces interactions et essayons de trouver une corrélation entre les états affectifs non verbaux et les échanges verbaux, reflétant le degré de (mauvaise) compréhension.Dans une deuxième partie, nous proposons de spécialiser, via l’incrémentation, un modèle générique à un ensemble fini d’individus à l’aide de données labélisées (de façon supervisée) pour gérer la problématique du biais d’identité. Le modèle Nearest Class Mean Forest (NCMF) peut faire de l’apprentissage incrémental, cependant, les stratégies existantes ne permettent pas de gérer des données complexes dont les distributions conditionnellement aux classes comportent plusieurs modes. À cet effet, nous proposons une stratégie incrémentale s’appuyant sur un critère statistique de séparabilité des modes de la distribution locale, qui va permettre de mettre à jour le centroïde du nœud ou d’en créer un nouveau, si cela s’avère nécessaire.Nous explorons également la possibilité de pouvoir intégrer un pipeline permettant de réaliser l'incrémentation de manière semi-supervisée afin de répondre à la problématique de la labélisation. Nous proposons à cet égard une méthode hybride qui combine le co-training et l'apprentissage incrémental, permettant à deux modèles de collaborer et de partager leurs connaissances. Contrairement à la méthode classique de cotraining qui effectue un ré-entraînement à partir de zéro à chaque itération de l'algorithme, notre approche effectue une incrémentation du modèle en continu sur de nouvelles observations.