Méthodologies pour l’Analyse Reproductible des Workflows Edge-to-Cloud
Auteur / Autrice : | Daniel Rosendo |
Direction : | Gabriel Antoniu, Patrick Valduriez, Alexandru Costan |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 01/06/2023 |
Etablissement(s) : | Rennes, INSA |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Rennes, Bretagne-Atlantique) |
Jury : | Président / Présidente : Maria Perez |
Examinateurs / Examinatrices : Gabriel Antoniu, Patrick Valduriez, Alexandru Costan, Maria Perez, Rosa Maria Badia, Ewa Deelman | |
Rapporteurs / Rapporteuses : Rosa Maria Badia, Ewa Deelman |
Mots clés
Résumé
Les infrastructures distribuées pour le calcul et l’analyse évoluent désormais vers un écosystème interconnecté permettant l’exécution d’applications complexes dans le continuum Edge-to-Cloud. Comprendre et optimiser les performances de bout en bout dans ce contexte est un défi majeur. Un besoin crucial consiste à reproduire avec précision les comportements pertinents des workflows et les paramètres représentatifs de l’infrastructure physique sous-jascente. Cette thèse est une contribution conceptuelle et pratique au continuum Edge-to- Cloud, proposant des méthodologies et les appliquant dans des environnements novateurs. Nos méthodologies ont pour but de s’affranchir de la complexité de la compréhension et de l’optimisation des workflows dans le continuum Edge-to-Cloud. Ainsi, elles permettent la conception d’expériences reproductibles, l’optimisation des applications, la capture efficace des données de provenance des exécutions de workflows, et la reproductibilité des expériences. Nous avons validé notre proposition avec, d’abord, le développement du framework E2Clab qui supporte le cycle complet d’analyse d’une application dans le continuum Edge-to-Cloud, et ensuite, l’utilisation de E2Clab pour l’optimisation Pl@ntNet, une application mondiale d’identification des plantes. La validation expérimentale à grande échelle sur Grid’5000 montre que notre méthodologie s’est avérée utile pour comprendre et améliorer les performances de Pl@ntNet.