Thèse en cours

Fouille de séquences de mobilité sémantique : Sur l'élaboration de mesures pour la comparaison, l'analyse et la découverte de comportements
FR  |  
EN
Accès à la thèse
Triangle exclamation pleinLa soutenance a eu lieu le 25/11/2021. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Clément Moreau
Direction : Thomas Devogele
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le
Soutenance le 25/11/2021
Etablissement(s) : Tours
Ecole(s) doctorale(s) : École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique Fondamentale et Appliquée de Tours
Jury : Président / Présidente : Anne Laurent
Examinateurs / Examinatrices : Thomas Devogele, Jerome Gensel, Christophe Claramunt, Marie-Jeanne Lesot, Cyril De runz, Verónika Peralta, Laurent Etienne
Rapporteurs / Rapporteuses : Jerome Gensel, Christophe Claramunt

Résumé

FR  |  
EN

"Dites-moi ce que vous avez fait, je vous dirai qui vous êtes''. Cet aphorisme, inspiré du livre Fondation de Isaac Asimov, interroge sur la prédictibilité et la compréhension actuelle de l'humain basée sur ses actions passées. Sommes-nous ce que nous faisons ? Cette question est devenue aujourd'hui un enjeu majeur pour de nombreux domaines comme le profilage d'individus ou les systèmes de recommandation qui cherchent, dans les actions passées des utilisateurs, un révélateur de leurs comportements futurs ou de leur psychologie. Dans cette thèse, nous ancrons la précédente réflexion dans le cadre de la mobilité humaine et proposons la mise en place d'une méthodologie complète (i.e., data pipeline) pour l'analyse et la découverte de comportements depuis un ensemble de séquences de mobilité sémantique. Cette méthodologie se base sur un examen approfondi de la littérature concernant les propriétés de la mobilité humaine ; nonobstant, elle fournit un cadre générique pour l'étude de toute séquence à caractère sémantique. Un processus d'apprentissage non supervisé (i.e., clustering) est en charge de l'extraction des comportements et une phase d'explicabilité post-process est assurée afin de traduire les clusters en comportements intelligibles. En conséquence, nous avons retenu un ensemble d'indicateurs visuels et statistiques complémentaires venant renseigner les différents aspects des séquences tout en veillant à rester suffisamment concis afin d'éviter une surcharge cognitive. Cette explication est indispensable pour des raisons pratiques et éthiques, mais aussi pour inclure l'utilisateur dans le processus de découverte. Également, les séquences en jeu étant complexes de par leur caractère temporel et leur possible multi-dimensionnalité sémantique (lieux, activités, mode de déplacement, etc), nous proposons deux nouvelles mesures pour la comparaison de telles séquences nommées Contextual Edit Distance et Fuzzy Temporal Hamming distance. Celles-ci sont respectivement inspirées de la distance d'édition et de la distance de Hamming, et viennent alimenter le précédant processus de clustering. Ces nouvelles mesures s'appuient sur les ontologies et la logique floue afin de pallier les lacunes à la fois sémantiques, temporelles et structurelles des distances originelles. Ces apports ont été appliqués sur différents jeux de données réelles issus du domaine de la mobilité -- physique (mobilité urbaine) et virtuelle (exploration de base de données) et ont permis d'améliorer significativement le processus d'interprétation et de découverte de comportements. Enfin, dans un but de ré-utilisabilité et de partage, une application web, SIMBA, vient parachever nos réalisations afin de permettre aux différents experts de s'approprier nos contributions au travers d'un outil interactif de fouille de données et analyse exploratoire. Les travaux de cette thèse s'inscrivent en collaboration de deux projets ANR et régional: Mobi'kids qui vise à comprendre et caractériser les formes d'autonomie et conditions d'évolution des mobilités quotidiennes des jeunes enfants. Et Smartloire, dont l'objectif est d'offrir un ensemble d'outils numériques à destination des professionnels du tourisme et décideurs politiques pour la recommandation d'itinéraires et l'analyse de traces touristiques en région Centre-Val de Loire.