Apprentissage de représentations pour les traces de mobilité
Auteur / Autrice : | Emeric Tonnelier |
Direction : | Patrick Gallinari |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 11/07/2019 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : LIP6 (1997-....) |
Jury : | Président / Présidente : Nicolas Maudet |
Examinateurs / Examinatrices : Patrice Aknin, Nicolas Baskiotis | |
Rapporteur / Rapporteuse : Latifa Oukhellou, Nicolas Labroche |
Mots clés
Mots clés contrôlés
Résumé
Le transport urbain est un enjeu crucial pour la gestion des territoires. Dans les grandes métropoles, les transports publics urbains représentent le principal moyen de déplacement de nombreux habitants. Si la caractérisation des réseaux et des usagers est historiquement abordée par l'analyse de données de questionnaires, depuis la fin des années 1990, nous voyons l'apparition de nouveaux types de données (GPS, données billétiques, etc.) qui décrivent la mobilité des individus en ville et son évolution à moyen terme. Disponibles dans de grandes quantités, échantillonnés précisément, mais contenant peu de sémantique et beaucoup de bruit. Au cours de cette thèse, nous proposons de travailler sur la modélisation des usagers et du réseau d'une part, et la détection d'anomalies d'autre part, à partir de données collectées dans un contexte de réseaux de transports urbains, en utilisant des méthodes d'apprentissage automatique. Grâce à ces méthodes adaptées à l'analyse et la mise en valeur de grandes masses de données, nous voulons traiter ces données brutes et bruitées. Nous porterons une attention particulière sur l'adaptation de ces méthodes aux problématiques particulières des données de mobilité. Nous verrons que la modélisation orientée usager d'un réseau de transports permet d'obtenir des profils fins et robustes que l'on peut agréger efficacement afin d'obtenir une valorisation plus précise et plus descriptive du réseau qu'une modélisation orientée réseau; que l'utilisation de ces profils permet de traiter des tâches complexes; que la contextualisation des modèles (spatial, temporel, comportements partagés) améliore les performances quantitatives et qualitatives.