Intégration de connaissance métier dans des algorithmes d'apprentissage non supervisé pour le transport ferroviaire
Auteur / Autrice : | Paul Riverain |
Direction : | Mohamed Nadif |
Type : | Thèse de doctorat |
Discipline(s) : | Science des données |
Date : | Soutenance le 09/03/2022 |
Etablissement(s) : | Université Paris Cité |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique PAris DEscartes (Paris ; 1998) |
Jury : | Président / Présidente : Miguel Couceiro |
Examinateurs / Examinatrices : Miguel Couceiro, Éric Gaussier, Allou Badara Samé, Stéphane Canu, Nadia Ghazzali | |
Rapporteur / Rapporteuse : Éric Gaussier, Allou Badara Samé |
Résumé
Dans un réseau de transport, la supervision joue un rôle essentiel pour assurer le bon déroulement des opérations et la satisfaction des voyageurs. Cela inclut la fourniture d'informations adéquates aux passagers, la gestion de la sécurité des passagers, des actifs fixes, des systèmes de traction et la supervision du trafic en temps réel. Dans cette thèse, nous abordons la conception de nouveaux outils algorithmiques orientés données pour aider les opérateurs des systèmes ferroviaires urbains dans leur tâche de supervision du réseau de transport. Dans la mesure où beaucoup de décisions des opérateurs dépendent de la façon dont les déplacements des usagers sont distribués sur le réseau, nous cherchons donc à fournir aux opérateurs des informations synthétiques sur le flux de passagers actuel et son évolution.Etant données les entrées et sorties des usagers sur le réseau, le flux de passagers peut être vu comme un graphe dynamique en temps discret dont les nœuds sont les stations du réseau et dont les arêtes comptent le nombre de passagers entre deux paires de stations. Nous cherchons donc à résumer ce graphe dynamique en utilisant des techniques de clustering. Les modèles à blocs, dont font partie le modèle à blocs stochastiques et le modèle à blocs latents, sont des approches probabilistes pour le co-clustering qui semblent adéquates pour cette tâche de clustering de graphe. Le clustering ne dépend ici que de la façon dont le flux de passagers est distribué sur le réseau et n'inclut pas les connaissances expertes des opérateurs. Par conséquent, nous cherchons également à prendre en compte des informations contextuelles telles que les caractéristiques des stations, la topologie du réseau ou les actions des opérateurs sur la régulation des trains dans la synthèse du flux de passagers. Nous passons d'abord en revue les principaux concepts sur lesquels nos travaux sont basés ainsi que certains travaux connexes sur l'apprentissage non supervisé pour l'analyse des flux de passagers. Nous proposons ensuite une formalisation du problème opérationnel. Dans notre première contribution, nous présentons une extension du modèle à blocs stochastiques (SBM) pour les graphes dynamiques à temps discret qui prend en compte la variabilité des degrés des nœuds, ce qui nous permet de modéliser une classe plus large de réseaux. Nous dérivons une procédure d'inférence basée sur un algorithme EM variationnel qui fournit également les moyens d'estimer les corrections de degré en fonction du temps. Dans notre deuxième contribution, nous proposons d'exploiter les connaissances préalables sous la forme d'une semi-supervision par paire dans l'espace des lignes et des colonnes afin d'améliorer les performances de classification des algorithmes dérivés du modèle à blocs latents (LBM). Nous introduisons un cadre probabiliste général pour incorporer les relations Must Link et Cannot Link dans le LBM basé sur les champs aléatoires de Markov cachés et présentons deux algorithmes d'inférence basés sur EM variationnel et EM classifiant. Enfin, nous présentons l'application des deux algorithmes précédents sur des données de flux de passagers du monde réel. Nous décrivons ensuite un outil interactif que nous avons créé pour visualiser les clusters obtenus avec un LBM dynamique et les interpréter en utilisant les paramètres estimés du modèle. Ensuite, nous appliquons les algorithmes de co-clustering sur trois échelles de temps différentes. Nous présentons les aspects pratiques liés à l'utilisation de ces algorithmes ainsi que les cas d'utilisation possibles de la supervision par paire. Enfin, nous détaillons les limites des algorithmes proposés et présentons quelques perspectives.