Thèse soutenue

Méthodologies pour l’Analyse Reproductible des Workflows Edge-to-Cloud

FR  |  
EN
Auteur / Autrice : Daniel Rosendo
Direction : Gabriel AntoniuPatrick ValduriezAlexandru Costan
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 01/06/2023
Etablissement(s) : Rennes, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Rennes, Bretagne-Atlantique)
Jury : Président / Présidente : Maria Perez
Examinateurs / Examinatrices : Gabriel Antoniu, Patrick Valduriez, Alexandru Costan, Maria Perez, Rosa Maria Badia, Ewa Deelman
Rapporteurs / Rapporteuses : Rosa Maria Badia, Ewa Deelman

Résumé

FR  |  
EN

Les infrastructures distribuées pour le calcul et l’analyse évoluent désormais vers un écosystème interconnecté permettant l’exécution d’applications complexes dans le continuum Edge-to-Cloud. Comprendre et optimiser les performances de bout en bout dans ce contexte est un défi majeur. Un besoin crucial consiste à reproduire avec précision les comportements pertinents des workflows et les paramètres représentatifs de l’infrastructure physique sous-jascente. Cette thèse est une contribution conceptuelle et pratique au continuum Edge-to- Cloud, proposant des méthodologies et les appliquant dans des environnements novateurs. Nos méthodologies ont pour but de s’affranchir de la complexité de la compréhension et de l’optimisation des workflows dans le continuum Edge-to-Cloud. Ainsi, elles permettent la conception d’expériences reproductibles, l’optimisation des applications, la capture efficace des données de provenance des exécutions de workflows, et la reproductibilité des expériences. Nous avons validé notre proposition avec, d’abord, le développement du framework E2Clab qui supporte le cycle complet d’analyse d’une application dans le continuum Edge-to-Cloud, et ensuite, l’utilisation de E2Clab pour l’optimisation Pl@ntNet, une application mondiale d’identification des plantes. La validation expérimentale à grande échelle sur Grid’5000 montre que notre méthodologie s’est avérée utile pour comprendre et améliorer les performances de Pl@ntNet.