Dense Linear Algebra Kernels on Heterogeneous Platforms: Redistribution Issue - LARA - Libre accès aux rapports scientifiques et techniques Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2000

Dense Linear Algebra Kernels on Heterogeneous Platforms: Redistribution Issue

Résumé

In this paper, we deal with redistribution issues for dense linear algebra kernels on heterogeneous platforms. In this context, processors speeds may well vary during the execution of a large kernel, which requires efficient strategies for redistributing the data along the computations. The strategy that we propose is to redistribute data after some well identified static phases and therefore, it is neither fully static nor fully dynamic. We present an optimal algorithm (under some assumptions) for redistributing data when performing matrix matrix multiplication.
Dans ce rapport, nous nous intéressons qu problème des redistributions de données pour les noyaux d'algèbre linéaire adaptés aux plateformes hétérogènes. la vitesses des différents processeurs pouvant varier au cours du temps sur ce type de plateformes, il est important de mettre en œuvre des stratégistes de redistributions efficaces afin de maintenir un bon équilibrage de charge tout a long du calcul. La stratégie hybride (ni complètement statique ni complètement dynamique) que nous proposons consiste à redistribuer les données après des phrases d'équilibrages statiques bine délimitées. Nous présentons également un algorithme optimal (sous certaines hypothèses) pour la redistribution des données lors du calcul d'un produit de matrices.
Fichier principal
Vignette du fichier
RR2000-45.pdf (340.59 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-02101771 , version 1 (17-04-2019)

Identifiants

  • HAL Id : hal-02101771 , version 1

Citer

Olivier Beaumont, Arnaud Legrand, Fabrice Rastello, Yves Robert. Dense Linear Algebra Kernels on Heterogeneous Platforms: Redistribution Issue. [Research Report] LIP RR-2000-45, Laboratoire de l'informatique du parallélisme. 2000, 2+15p. ⟨hal-02101771⟩
54 Consultations
72 Téléchargements

Partager

Gmail Facebook X LinkedIn More