Algorithm Comparison
|
  T42L2   |
  T42L2   |
  T42L16  |
  T85L4   |
  T85L4   |
  T85L32  |
|
  P=2x32   |
  P=4x16   |
  P=8x8   |
  P=2x32   |
  P=4x16   |
  P=8x8   |
|   optimal algorithm   |
halfsum  |
halfsum  |
halfsum  |
ringsum  |
halfsum  |
ringsum  |
|   (allreduce-min)/min   |
  0.478  |
  0.167  |
  0.128  |
  1.680  |
  0.344  |
  0.276  |
|   (generic-min)/min   |
  1.371  |
  0.587  |
  0.047  |
  0.003  |
  0.067  |
  0.111  |
|