Algorithm Comparison
|
  T10L16  |
  T21L8   |
  T21L32  |
  T21L16  |
  T42L16  |
|
  P=16   |
  P=8   |
  P=32   |
  P=16   |
  P=8   |
|   optimal algorithm   |
logtrans  |
swtrans  |
swtrans  |
swtrans  |
swtrans  |
|   (alltoallv-min)/min   |
  0.136  |
  0.066  |
  0.914  |
  0.180  |
  0.236  |
|   (generic-min)/min   |
  0.078  |
  0.009  |
  0.024  |
  0.037  |
  0.005  |
|