Mise en place d'extensions de GALACTIC pour l'analyse de séries numériques temporelles géolocalisées. Applicatif sur l'analyse de données issues de capteurs des portes d'écluses du Grand Port Maritime de La Rochelle
Auteur / Autrice : | Guillaume Savarit |
Direction : | Karell Bertet, Christophe Demko |
Type : | Projet de thèse |
Discipline(s) : | Informatique et Applications |
Date : | Inscription en doctorat le 01/02/2022 |
Etablissement(s) : | La Rochelle |
Ecole(s) doctorale(s) : | EUCLIDE |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Informatique image et interaction |
Mots clés
Mots clés libres
Résumé
L'objectif général de cette thèse sera de mettre en place des outils d'analyses de séries numériques temporelles adaptés aux données issues des capteurs en utilisant l'outil Galactic. Un tel outil danalyse repose sur deux objectifs scientifiques distincts : 1. Extensions de GALACTIC pour des séries numériques temporelles Un premier objectif de ce projet sera d'enrichir l'eco-système de GALACTIC avec de nouvelles extensions pour des séries numériques temporelles. Ces extensions reposeront sur des outils existants : Données numériques : Des extensions pour des données numériques ont été développées dans la plateforme GALACTIC, qui fournissent des descriptions de groupes de données par des prédicats de type « est plus grand/petit que » où les valeurs sont calculées automatiquement pour chaque sous-groupe. Différentes stratégies d'exploration de l'espace de recherche sont proposées, en fonction de la médiane ou encore des quartiles des valeurs de chaque sous-groupe. Séquences temporelles : Des extensions pour des données de type séquences ont été proposés dans le cadre du projet régional DA3T (Dispositif d'Analyse des Traces numériques pour la valorisation des Territoires Touristiques). Il s'agit d'un projet interdisciplinaire réunissant géographes et informaticiens dont l'objectif est de proposer un dispositif d'analyse des traces numériques dans le but d'améliorer la gestion et la valorisation des territoires touristiques en Nouvelle-Aquitaine. Notre contribution porte sur de nouvelles méthodes de fouille de séquences issues de ces traces numériques, qui ont permis d'identifier des comportements touristiques pertinents. Ces méthodes reposent sur des extensions de GALACTIC pour des séquences de symboles (<si>), pour des séquences temporelles (<si, ti >) qui associent une information temporelle ti à chaque symbole si, et pour des séquences d'intervalles (<si, bi, ei >) qui associent un intervalle temporel [bi,ei] à chaque symbole si. Les groupes de séquences sont décrits par leurs plus grandes sous-séquences communes, ou par leurs plus grands préfixes communs, avec la possibilité d'intégrer l'information temporelle. Plusieurs stratégies ont été proposées, à la fois des stratégies naïves qui considèrent l'ensemble de l'espace de recherche, mais aussi des stratégies plus fines qui intègrent les symboles et/ou l'information temporelles. Nous avons montré que ces méthodes étendent et enrichissent les approches existantes en fouille de séquences. Sur la base de ces extensions, il s'agira de fournir de nouvelles extensions à GALACTIC permettant de décrire des séries numériques temporelles, et de fournir différentes stratégies d'exploration. Différentes extensions seront ainsi à mettre en place : Une extension pour les séries numériques (<xi >) Une extension pour les séries numériques temporelles (<xi, ti>) ou (<xi, bi, ei>) où la série numérique (<xi >) est enrichie d'une information temporelle ti ou un intervalle de temps [bi, ei ] 2. Analyse interactive des données issues de capteurs Un second objectif sera de mettre le métier d'analyste de données au cur du processus d'analyse avec une analyse interactive des séries numériques issues des différents capteurs installés sur le port. Il s'agira pour cela de développer des outils d'interfaces logicielles et les supports de documentation et de formation associés. Ces outils permettront à l'analyste de données de : Sélectionner le ou les types de données voulues en fonction de son objectif. Sélectionner de façon interactive plusieurs stratégies d'exploration et de filtrage des données pour raffiner chaque concept. Visualiser la hiérarchie des concepts générés, ainsi que l'information contenue dans chaque concept Exporter la connaissance extraite sous forme de règles « si alors » ou encore de sous-groupes pertinents. Un accompagnement ingénieur est prévu pour le développement des interfaces, financé par la SATT (Société d'Accélération de Transfert Technologique) pour une montée en maturation de la plateforme GALACTIC.