Thèse en cours

Traitement multi-échelle des données spatio-temporelles appliquées à la qualité de l'air dans les zones urbaines

FR  |  
EN
Auteur / Autrice : Maryam Rahmani
Direction : Romain Rouvoy
Type : Projet de thèse
Discipline(s) : Informatique et applications
Date : Inscription en doctorat le 01/09/2021
Etablissement(s) : Université de Lille (2022-....)
Ecole(s) doctorale(s) : MADIS Mathématiques, sciences du numérique et de leurs interactions
Partenaire(s) de recherche : Laboratoire : CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille
Equipe de recherche : CRIStAL-INRIA

Résumé

FR  |  
EN

La présence de différents polluants (gazeux ou particules) dans l'air des zones urbaines entraîne des maladies graves et une détérioration indésirable de notre environnement. Si les décideurs politiques se sont emparés du sujet, ils continuent de trébucher sur les causes de ces dégradations, émettant diverses hypothèses quant à leurs origines. Jusqu'à présent, le manque de mesures in situ largement déployées, ainsi que l'exploitation de modèles méso-échelle inadéquats, entraînent des difficultés considérables dans l'analyse et la prédiction de l'évolution de l'exposition aux polluants. En effet, non seulement les polluants mais aussi une grande diversité de facteurs contextuels (couloirs de vent, prévisions météorologiques, constructions / routes à proximité, incidents environnants, etc.) peuvent contribuer à l'amélioration ou à la dégradation de la qualité de l'air. La thèse vise donc à revisiter les approches de pointe des infrastructures informatiques réparties pour faire face au défi multi-échelles soulevé par les techniques modernes de surveillance de la qualité de l'air. En particulier, nous visons à concevoir, mettre en œuvre et déployer une approche de modélisation multi-échelles qui peut tirer parti du volume et de la diversité des mesures acquises sur le terrain pour recommander des déploiements in situ de stations de mesure (mobiles ou stationnaires) afin de déduire des modèles de propagation à l'échelle microscopique (e.g., rues), avec précision. Ensuite, ce modèle de propagation en ligne tirera parti des techniques d'intelligence artificielle, telles que l'apprentissage automatique, non seulement pour cartographier la propagation locale des particules, mais aussi pour localiser les émetteurs de particules et ainsi fournir un inventaire ouvert et continuellement mis à jour des émissions de particules, ce qui n'a jamais été le cas. Fournir une caractérisation à cette résolution constitue donc une innovation forte, au-delà de l'état de l'art. Pour atteindre ces objectifs ambitieux, nous comptons mettre à profit notre expérience dans la conception de systèmes de traitement de données distribués à grande échelle. La thèse a l'intention de bénéficier de la base de données d'apprentissage automatique GreyCat pour soutenir la mise en œuvre de notre approche de modélisation multi-échelles. GreyCat prend en charge le stockage et le traitement de séries chronologiques complexes sous forme de graphiques temporels, qui sont une structure de données flexible pour modéliser et raisonner sur des systèmes dynamiques complexes. L'originalité de GreyCat réside dans sa capacité à intégrer des algorithmes d'apprentissage automatique (modèles de mélange gaussien, réseaux de neurones récurrents, etc.) en tant que nœuds dans le graphe pouvant apprendre du voisinage. Nous pensons que cette approche offre une base appropriée pour concevoir et construire des modèles de propagation à l'échelle microscopique composés de modèles à l'échelle méso.