Thèse soutenue

Analyse et prédiction du comportement humain dans des séquences temporelles non contrôlées

FR  |  
EN
Auteur / Autrice : Benjamin Szczapa
Direction : Mohamed DaoudiAlberto Del Bimbo
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 30/09/2022
Etablissement(s) : Université de Lille (2022-....) en cotutelle avec Università degli Studi di Firenze
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)
Partenaire(s) de recherche : Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille
Jury : Président / Présidente : Denis Hamad
Examinateurs / Examinatrices : Stefano Berretti, Pietro Pala, Zakia Hammal, Claudio Ferrari
Rapporteurs / Rapporteuses : Denis Hamad, Djamila Aouada

Résumé

FR  |  
EN

La compréhension du comportement humain est sujet de recherche important depuis plusieurs années. En effet, le développement de nouvelles machines qui travaillentet aident les humains dans leur quotidien n'a jamais été aussi important aujourd'hui. Il est alors important de développer des méthodes appropriées pour une meilleure compréhension du comportement humain. Dans ce sens, les récents progrès en informatique et en vision par ordinateur ont permit le développement de ces méthodes. La compréhension des mouvements du corps et du visage peut être effectuée par la détection de points de repères 2D ou 3D à partir de différentes sources comme une vidéo or le flux d'une caméra. Cette acquisition nous permet de construire une séquence temporelle de configurations de points de repères qui peuvent être traitées pour répondre à différents problèmes, comme la reconnaissance d'actions ou d'émotions. Cependant, des déformations peuvent être observées pendant l'analyse, du fait des changements de point de vue, la détection ou le suivi incorrect des points de repères, particulièrement dans les situations non contrôlées. Dans cette thèse, nous proposons deux approches spatio-temporelles basées sur les points de repères du corps et du visage. La représentation avec des matrices de Gram définie des matrices définissent semi-positives de rang fixe qui vivent sur des variétés Riemannienne non linéaires, sur lesquelles les techniques classiques de calculs et d'apprentissages machine ne peuvent pas être appliquées. Pour surmonter ce problème, les trajectoires définissent par des séquences de matrices de Gram sur la variété des matrices définissent semi-positives sont analysées en considérant une métrique qui respecte la géométrie Riemanienne sur la variété. L'approche proposée a été évaluée sur différentes applications d'analyse du mouvement du corps et de la reconnaissance d'action à partir de points de repères sur lecorps en 2D et 3D, ainsi que sur l'analyse d'expressions faciales pour estimer le niveau de douleur à partir de points de repères faciaux. La seconde approche proposée utilise un réseau de neurone basé sur un réseau conventionnel sur les graphes et le Transformer, qui combine le calcul de l'attention au niveau spatial et temporel de séquences de repères faciaux 2D. Cette approche a été évaluée sur l'estimation de l'indice de douleur au niveau des séquences. Les résultats obtenus par l'application des deux approches sur des jeux de données importants sont compétitifs avec les récents résultats obtenus dans l'état de l'art.