Algorithm Comparison
|
  T21L16  |
  T42L16  |
  T42L32  |
  T42L16  |
  T85L32  |
|
  P=4x16   |
  P=8x8   |
  P=2x32   |
  P=4x16   |
  P=8x8   |
|   optimal algorithm   |
logtrans  |
srtrans  |
swtrans  |
srtrans  |
srtrans  |
|   (alltoallv-min)/min   |
  0.104  |
  0.052  |
  1.503  |
  0.357  |
  0.158  |
|   (generic-min)/min   |
  0.151  |
  0.021  |
  0.015  |
  0.015  |
  0.049  |
|