Thèse en cours

Caractérisation des traces de mobilité humaine à l'aide de procédé d'apprentissage par représentation dynamique et de graphe de connaissance

FR  |  
EN
Auteur / Autrice : Romain Haton
Direction : Amel Bouzeghoub
Type : Projet de thèse
Discipline(s) : Informatique, données, IA
Date : Inscription en doctorat le 01/11/2022
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : SAMOVAR - Services répartis, Architectures, Modélisation, Validation, Administration des Réseaux

Résumé

FR  |  
EN

Avec l'adoption généralisée des appareils mobiles connectés, il est désormais facile de collecter des données de mobilité via des données cellulaires (CDR, XDR) ou via l'enregistrement direct d'informations GPS. Ces ensembles de données ont élargi notre compréhension de la loi qui sous-tend les comportements de mobilité humaine, ce qui est crucial dans une variété de domaines tels que la modélisation des épidémies (Digital Contact Tracing), la gestion du trafic et la sécurité nationale pour n'en citer que quelques-uns. L'une des façons de modéliser la mobilité spatio-temporelle des personnes a été par une approche de graphe bipartite. En effet, par rapport à d'autres approches de modélisation, il nous permet de lier dynamiquement les utilisateurs avec des POI (point d'intérêt) qui nous permettent d'utiliser une technique basée sur la prédiction de liens pour prédire les déplacements futurs ou des motifs/graphes et pour produire des informations sémantiques sur la localisation des personnes. Dans ce contexte, l'apprentissage de la représentation présente une opportunité intéressante de modéliser l'évolution dynamique du graphe bipartite des utilisateurs et des POI, où chaque utilisateur/POI peut être intégré dans un espace euclidien et son évolution peut être modélisée par une trajectoire d'intégration dans cet espace. Au-delà des trajectoires spatio-temporelles pour prédire avec précision la mobilité, il faut aussi comprendre le rôle du contexte sur la mobilité humaine. Par exemple, nous voulons comprendre si le fait de savoir qu'une personne fait du shopping nous informera souvent de la prévisibilité globale de cette personne. Intuitivement, les graphes de connaissances peuvent naturellement décrire ces corrélations provenant de multiples sources. Par conséquent, ils fournissent une solution prometteuse pour extraire des connaissances structurées à partir de données massives. Intégrer la corrélation sémantique des données multi-sources est la clé pour améliorer la capacité à prédire la mobilité. Les approches traditionnelles produisent des représentations vectorielles qui capturent les distributions mondiales. Cependant, de telles représentations d'utilisateurs ou d'éléments ne capturent pas les connaissances de base, le contexte situationnel ou l'historique séquentielle des événements. Par exemple, la recommandation d'un restaurant peut dépendre d'informations sur le type de cuisine, de facteurs contextuels tels que l'heure de la journée, la météo ou le lieu, ainsi que de l'historique et de l'expérience de cet utilisateur dans des situations précédentes. L'objectif de cette thèse sera de développer un modèle d'apprentissage de la représentation graphique pour dériver des caractéristiques significatives liées aux mouvements humains qui profitent à la fois de la dynamique spatio-temporelle de la mobilité des personnes et de l'information sur les connaissances.