Intégration et analyse de données hétérogènes massives pour une observation intelligente du territoire
Auteur / Autrice : | Rodrique Kafando |
Direction : | Maguelonne Teisseire |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 03/12/2021 |
Etablissement(s) : | Montpellier |
Ecole(s) doctorale(s) : | École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Territoires, Environnement, Télédétection et Information Spatiale (Montpellier) |
Jury : | Président / Présidente : Carmen Gervet |
Examinateurs / Examinatrices : Maguelonne Teisseire, Carmen Gervet, Jérôme Darmont, Franck Ravat, Carmen Brando Escobar, Lucile Sautot | |
Rapporteur / Rapporteuse : Jérôme Darmont, Franck Ravat |
Mots clés
Résumé
L’avènement des nouvelles technologies de la communication et de l’information (NTIC) accélère la croissance des données produites par les services qu’offrent les grandes villes à leur population dans divers domaines. Parmi ces données, nous pouvons citer : les données textuelles (disponibles sur le Web), les images satellites (données de surveillance), les données issues de capteurs, etc. Ces données sont essentiellement issues des services proposés pour répondre aux besoins quotidiens des habitants comme la mobilité, la communication, la santé, ainsi que les services de gestion des différentes ressources comme l’eau, les exploitations agricoles et urbaines, l’énergie, etc. Cette forte croissance remet en question la complétude et l'efficacité des méthodes et techniques classiquement utilisées en fouille de données. Les difficultés rencontrées sont principalement liées à la volumétrie des données, mais aussi à leur complexité telle que la forte hétérogénéité. Notre sujet de recherche s’inscrit dans le cadre de la démarche ÉcoCité de la Métropole de Montpellier Méditerranée (3M), et vise à développer une démarche d’observation intelligente du territoire à partir des masses de données dont-elle dispose.Dans cette thèse, nous nous intéressons à l'enrichissement mutuelle entre des données fortement hétérogènes pour le suivi des territoires. Nous limitons notre étude à trois thématiques qui sont, l’urbanisation, l’agriculture et l’hydrologie sur le territoire de la métropole de Montpellier. Pour ce faire, nous déclinons dans cette étude, une chaîne de traitement qui regroupe des approches permettant : 1) de collecter des séries temporelles de données textuelles pour la constitution de corpus thématiques avec un ancrage sur le plan spatial et de les analyser, 2) de stocker ces données massives et hétérogènes afin de les rendre accessibles et analysables par tous, sans pour autant les détériorer, 3) d’extraire des indicateurs permettant de mettre en relation les données des différentes thématiques, tant sur le plan spatial, temporel que thématique, et 4) d’extraire des connaissances à partir de ces données, afin de montrer l’impact de ces thématiques sur l’évolution du territoire de façon globale. À partir de ces différentes approches, nous mettons en évidence l'importance de la mise en relation de données gérées jusqu'ici en silo, en faisant ressortir des connaissances pouvant servir de système d’aide à la décision.L'ensemble des approches méthodologiques que nous proposons dans cette étude, constitue une chaîne de traitement complète, allant de la collecte des données hétérogènes à leur mise en relation et analyse pour l'extraction des connaissances pour la description d’événements territoriaux sur le plan spatio-temporel.