Dense Linear Algebra Kernels on Heterogeneous Platforms: Redistribution Issue
Résumé
In this paper, we deal with redistribution issues for dense linear algebra kernels on heterogeneous platforms. In this context, processors speeds may well vary during the execution of a large kernel, which requires efficient strategies for redistributing the data along the computations. The strategy that we propose is to redistribute data after some well identified static phases and therefore, it is neither fully static nor fully dynamic. We present an optimal algorithm (under some assumptions) for redistributing data when performing matrix matrix multiplication.
Dans ce rapport, nous nous intéressons qu problème des redistributions de données pour les noyaux d'algèbre linéaire adaptés aux plateformes hétérogènes. la vitesses des différents processeurs pouvant varier au cours du temps sur ce type de plateformes, il est important de mettre en œuvre des stratégistes de redistributions efficaces afin de maintenir un bon équilibrage de charge tout a long du calcul. La stratégie hybride (ni complètement statique ni complètement dynamique) que nous proposons consiste à redistribuer les données après des phrases d'équilibrages statiques bine délimitées. Nous présentons également un algorithme optimal (sous certaines hypothèses) pour la redistribution des données lors du calcul d'un produit de matrices.
Origine | Fichiers produits par l'(les) auteur(s) |
---|