Task Ordering in Linear Tiles.

Fabrice Rastello; Amit Rao; Santosh Pande

Rapport (Rapport De Recherche) Année : 1998

Task Ordering in Linear Tiles.

(1) , (1) , (1)

Fabrice Rastello

Fonction : Auteur

Laboratoire de l'Informatique du Parallélisme

Amit Rao

Fonction : Auteur

Laboratoire de l'Informatique du Parallélisme

Santosh Pande

Fonction : Auteur

Laboratoire de l'Informatique du Parallélisme

Résumé

In this report we address the issue of loop tiling to minimize the completion time of the loop when executed on multicomputers. We remove the restriction of atomicity of tiles and internal parallelism within tiles is exploited by overlapping computation with communication. The effectiveness of tiling is then critically dependent on the execution order of tasks within a tile. In this paper we present a theoretical framework based on equivalence classes that provides an optimal task ordering under assumptions of constant and different permutations of tasks in individual tiles. Our framework is able to handle constant but compile-time unknown dependences by generating optimal task permutations at run-time and results in significantly lower loop completion times. Our solution is an improvement over previous approaches and is optimal for all problem instances. We also propose efficient algorithms that provide the optimal solution. The framework has been implemented as an optimization pass in the SUIF compiler and has been tested on distributed and shared memory systems using a message passing model. We show that the performance improvement over previous results is substantial.

Étant donné un nid de boucles 1-dimensionnel avec des dépendances uniformes et une distribution regulière des tâches sur une chaîne de processeurs. Nous adressons ici le problème du réordonnancement des tâches à l'intérieur même de chaque tuile afin de pipeliner les communications. En fait, nous cherchons à utiliser le parallélisme interne à chaque tuile afin de réduire la latence dans une direction critique ; ces résultats pouvant s'appliquer à des nids de boucles multidirectionnels. Les approches précedantes se tenant à chercher une permutation constante des tâches à l'intérieur de chaque tuiles, nous avons d'abord résolu se problème de manière optimale (algorithme 3) puis comparé cet algorithme à un algorithme utilisant des permutations non constantes (algorithme 4). La construction de l'algorithme 3 à nécessité la mise en oeuvre d'une formalisation mathématiques du problème suivit de preuves substentielles. C'est ce qui constitue le corps de ce rapport. Si clairement dans le cas 1-directionnel nos résultats montrent la supériorité de l'algorithme 4, certains paramètres laissent à penser que dans les dimensions supérieures, un algorithme de type 3 serait peut être plus efficace...}.

Mots clés

Automatic Parallelization Equivalence Classes Nested Loop Pipelined Communications Reordering Tiling Uniform Dependances

Classes d'Equivalence Communications Pipelinées Dépendances Uniformes Nids de Boucle Parallélisation Automatique Pavage Réordonnancement

Domaines

Informatique [cs]

Fichier principal

RR1998-11.pdf (399.79 Ko)

Origine	Fichiers produits par l'(les) auteur(s)

Colette ORANGE : Connectez-vous pour contacter le contributeur

https://hal-lara.archives-ouvertes.fr/hal-02101991

Soumis le : mercredi 17 avril 2019-09:11:30

Dernière modification le : mardi 12 novembre 2024-15:20:06

Dates et versions

hal-02101991 , version 1 (17-04-2019)

Identifiants

HAL Id : hal-02101991 , version 1

Citer

Fabrice Rastello, Amit Rao, Santosh Pande. Task Ordering in Linear Tiles.. [Research Report] LIP RR-1998-11, Laboratoire de l'informatique du parallélisme. 1998, 2+20p. ⟨hal-02101991⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-LYON CNRS INRIA UNIV-LYON1 LARA UDL

34 Consultations

114 Téléchargements

HAL-LARA

Task Ordering in Linear Tiles.

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager