Des approches séquentielles et parallèles pour l’amélioration des performances des sélections et des agrégations des données rasters
Auteur / Autrice : | Driss En-Nejjary |
Direction : | François Pinet, Myoung-Ah Kang |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 10/06/2021 |
Etablissement(s) : | Université Clermont Auvergne (2021-...) |
Ecole(s) doctorale(s) : | École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes - Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes |
Jury : | Examinateurs / Examinatrices : Olivier Teste, Jean-Denis Mathias |
Rapporteur / Rapporteuse : Alain Bouju, Sofian Maabout |
Mots clés
Résumé
Ces dernières années, la production des données spatiales a connu un bond qualitatif et quantitative. En effet, Les énormes progrès technologiques, tels que les smartphones, l'Internet des objets, les systèmes de navigation et les capteurs ont conduit à la production des données spatiales de grande taille et à haute définition. Les capteurs, par exemple, sont maintenant plus précis, moins chers et plus performants générant des données haute précision et à grande fréquence. Proposer des requêtes et des opérations d’analyse puissantes et à grande échelle devient cruciale et essentielle dans plusieurs applications et domaines. Le secteur d’agriculture et environnemental est l'un des domaines touchés par ces progrès de la technologie d'acquisition de données. Interroger et analyser ce jeu de données permet d'extraire des informations vitales pour la prédiction, la prise de décision, et l'avancement scientifique. Malheureusement, la plupart des méthodes et approches existantes sont basées sur une approche traditionnelle à base de CPU (monoprocesseurs), ce qui les rend non évolutives, inadéquates pour traiter des données à grande échelle et prennent beaucoup de temps pour l’exécution.Dans ce travail, nous montrons que l'utilisation du GPGPU peut réduire le temps de traitement des données spatiales et économiser les calculs. À cet égard, nous avons proposé d'accélérer une opération d’agrégation et deux requêtes classiques qui n'avaient jamais été abordées auparavant dans la littérature.Tout d'abord, nous avons proposé une méthode parallèle optimisée en utilisant GPGPU pour produire des résumés de données basée sur l’agrégation chevauchées, plus précisément,Le calcul de la température moyenne des séquences chevauchées des rasters de taille fixe.Dans un second temps, nous avons abordé la requête de sélection des rasters basée sur un seuil fixé par l'utilisateur. En effet, dans différents scénarios, les utilisateurs ne peuvent s'intéresser qu'à certains rasters. Par conséquent, nous avons mis en place deux solutions robustes basées sur le GPGPU et le CPU qui incluent une procédure de rejet des rasters aussitôt que possible pour réduire le temps d’exécution en utilisant une étape de trie. Finalement, nous avons proposé deux méthodes basées sur le GPGPU et le CPU pour une requête de sélection des séquences des rasters non chevauchés à base de leurs moyennes selon un seuil fixé par l’utilisateur.