Algorithm Comparison
|
  T21L16  |
  T42L16  |
  T42L32  |
  T42L16  |
  T85L32  |
|
  P=16x4   |
  P=8x8   |
  P=32x2   |
  P=16x4   |
  P=8x8   |
|   optimal algorithm   |
logtrans  |
srtrans  |
swtrans  |
srtrans  |
srtrans  |
|   (alltoallv-min)/min   |
  0.177  |
  0.063  |
  1.760  |
  0.900  |
  0.557  |
|   (generic-min)/min   |
  0.127  |
  0.028  |
  0.025  |
  0.026  |
  0.019  |
|