Dataflow dot product on networks of heterogeneous digit-serial arithmetic units
Résumé
In this paper we deal with a new high precision computation of the dot product. The key idea is to use hundreds of digit-serial arithmetic units that allow a massive digit-level pipelining. Parallel discrete-event simulations performed on a memory-distributed massively parallel computer show that with a limited number of arithmetic units, the computation of dot product when performed using a ``classical'' algorithmic technique (i.e. serial cumulative multiplications) is almost as fast as the case where an ``optimal'' divide-and-conquer algorithmic technique is used. Interconnection networks for both algorithmic techniques are considered.
Ce document décrit un produit scalaire a haute precision. L'idée principale est dutiliser plusieurs centaines d'unités arithmétiques permettant le "pipeline" au niveau du chffre Des simulations parallèles d'évènements discrets faites sur des machines parallèles à mémoire distribuée montrent que lorsque le produit scalaire est calculé avec un nombre fixe d'unités un ordononnancement de multiplications cumulatifs est presque aussi rapide qu'un ordononnancement "divide-and-conquer" .Les reseaux d'interconnection pour les deux techniques sont aussi présentes
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...