Towards reproducible, accurately rounded and efficient BLAS
Auteur / Autrice : | Chemseddine Chohra |
Direction : | Philippe Langlois, David Parello |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 10/03/2017 |
Etablissement(s) : | Perpignan |
Ecole(s) doctorale(s) : | École doctorale Énergie environnement (Perpignan ; 1999-....) |
Partenaire(s) de recherche : | Equipe de recherche : Équipe de recherche Digits, architectures et logiciels informatiques (Perpignan) |
Laboratoire : Laboratoire d'informatique, de robotique et de micro-électronique (Montpellier ; 1992-....) | |
Jury : | Examinateurs / Examinatrices : Fabienne Jézéquel, Marc Baboulin, Alfredo Buttari, Jean-Guillaume Dumas, Marc Daumas, David Defour |
Rapporteurs / Rapporteuses : Fabienne Jézéquel, Marc Baboulin |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Le problème de non-reproductibilté numérique surgit dans les calculs parallèles principalement à cause de la non-associativité de l’addition flottante. Les environnements parallèles changent dynamiquement l’ordre des opérations. Par conséquent, les résultats numériques peuvent changer d’une exécution à une autre. Nous garantissons la reproductibilité en étendant autantque possible l’arrondi correct à des séquences de calculs plus importantes que les opérations arithmétique exigées par le standard IEEE-754. Nous introduisons RARE-BLAS une implémentation des BLAS qui est reproductible et précise en utilisant les transformations sans erreur et les algorithmes de sommation appropriés. Nous présentons dans cette thèsedes solutions pour le premier (asum, dot and nrm2) et le deuxième (gemv and trsv) niveaux des BLAS. Nous développons une implémentation de ces solutions qui utilise les interfaces de programmation parallèles (OpenMP et MPI) et les jeu d’instructions vectorielles. Nous comparons l’efficacité de RARE-BLAS à une bibliothèque optimisé (Intel MKL) et à des solutionsreproductibles existantes.