PSTSWM AlphaSC-667 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(ordered swap of 8KB message using MPI within a node)

(performance measured per processor when all processors in node communicating)

> Latency Definition:
Date/Person: July 17, 2000 / P. Worley
Platform: Compaq AlphaServer SC at Oak Ridge National Laboratory (falcon.ccs.ornl.gov):
     64 ES40 4-way SMP nodes (667 MHz Alpha 21264a with 8MB L2 cache)
Environment: SC System v1.0; Digital UNIX V5.0;   RMS 2.37
Communication Library: MPI
SWAP size: 1024 REAL*8 floating point values each direction
Message size: Largest - 1024 REAL*8 floating point values
Smallest - 1 REAL*8 floating point values
Processors: 0 and 1
2 and 3
(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 80.63 11.83 58.5%
1 iter. 137.45 11.65 63.8%
10 iter. 155.48 11.64 64.9%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 78.47 11.51 59.8%
1 iter. 132.77 11.57 64.0%
10 iter. 158.79 11.72 64.4%
cache inv. w/overlap 71.86 11.36 58.3%
1 iter. w/overlap 134.30 11.50 63.7%
10 iter. w/overlap 154.54 12.02 64.3%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 81.43 12.54 58.5%
1 iter. 132.56 12.19 63.2%
10 iter. 152.27 12.46 63.1%
cache inv. w/overlap 83.34 12.07 59.7%
1 iter. w/overlap 140.51 12.24 63.4%
10 iter. w/overlap 161.96 14.19 62.3%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 75.71 12.61 58.1%
1 iter. 132.34 12.74 62.4%
10 iter. 157.27 12.67 63.2%
cache inv. w/overlap 82.08 12.57 59.1%
1 iter. w/overlap 140.51 12.35 63.1%
10 iter. w/overlap 160.66 14.02 63.2%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 66.12 25.79 40.4%
1 iter. 119.07 23.01 49.2%
10 iter. 127.64 25.09 45.6%
cache inv. w/overlap 82.25 12.00 59.4%
1 iter. w/overlap 142.97 12.00 63.9%
10 iter. w/overlap 157.81 14.70 61.2%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 69.96 25.59 41.1%
1 iter. 118.55 26.22 43.5%
10 iter. 125.68 26.95 42.1%
cache inv. w/overlap 81.84 12.31 59.5%
1 iter. w/overlap 134.96 12.27 63.1%
10 iter. w/overlap 160.69 14.25 62.7%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 80.31 24.57 42.7%
1 iter. 118.55 25.90 42.9%
10 iter. 127.74 24.24 46.5%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 70.50 18.93 46.8%
1 iter. 130.24 19.28 51.1%
10 iter. 155.09 19.29 52.1%
cache inv. w/overlap 69.48 19.09 46.5%
1 iter. w/overlap 130.45 18.99 51.8%
10 iter. w/overlap 156.10 19.96 51.9%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 73.67 18.66 48.9%
1 iter. 128.60 18.68 52.8%
10 iter. 151.59 18.65 53.6%
cache inv. w/overlap 79.61 18.69 49.1%
1 iter. w/overlap 137.91 18.25 53.9%
10 iter. w/overlap 156.87 20.14 54.2%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 74.27 18.43 48.6%
1 iter. 125.84 18.67 52.6%
10 iter. 149.33 18.76 53.7%
cache inv. w/overlap 79.92 18.62 49.1%
1 iter. w/overlap 129.21 18.65 52.5%
10 iter. w/overlap 154.62 20.16 54.4%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 78.69 19.04 47.1%
1 iter. 132.77 19.43 50.4%
10 iter. 154.25 19.22 52.2%


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.4069e-02   2.3505e-05   0.68   0.55   0.58   1.20 
  16   1.2114e-02   2.3659e-05   1.35   0.54   0.58   1.20 
  32   5.9888e-03   2.3394e-05   2.74   0.54   0.59   1.18 
  64   3.5050e-03   2.7383e-05   4.67   0.50   0.53   1.15 
  128   1.9928e-03   3.1137e-05   8.22   0.44   0.45   0.97 
  256   1.2344e-03   3.8575e-05   13.27   0.34   0.35   0.86 
  512   1.4034e-03   8.7712e-05   11.67   0.13   0.12   0.28 
  1024   7.4400e-04   9.3000e-05   22.02   0.12   0.11   0.29 
  2048   4.2720e-04   1.0680e-04   38.35   0.11   0.09   0.27 
  4096   2.7460e-04   1.3730e-04   59.66   0.10   0.09   0.20 
  8192   2.0120e-04   2.0120e-04   81.43   0.08   0.08   0.23 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   1   0   2   3   9 
  16   0   1   2   3   8 
  32   1   0   2   3   8 
  64   1   0   2   3   8 
  128   0   1   2   3   9 
  256   0   1   2   3   10 
  512   0   1   2   3   10 
  1024   0   1   2   3   10 
  2048   0   1   2   10   7 
  4096   0   1   3   2   10 
  8192   2   0   6   10   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   4 
  16    1   2   4 
  32    1   2   4 
  64    1   2   4 
  128    2   2   4 
  256    1   2   4 
  512    1   3   9 
  1024    1   3   10 
  2048    1   3   10 
  4096    1   3   11 
  8192    2   5   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.3819e-02   2.3260e-05   0.69   0.57   0.60   1.28 
  16   1.1970e-02   2.3379e-05   1.37   0.57   0.60   1.30 
  32   5.8658e-03   2.2913e-05   2.79   0.58   0.61   1.31 
  64   3.4408e-03   2.6881e-05   4.76   0.51   0.54   1.11 
  128   1.9256e-03   3.0087e-05   8.51   0.43   0.48   0.93 
  256   1.1716e-03   3.6613e-05   13.98   0.34   0.38   0.72 
  512   1.3608e-03   8.5050e-05   12.04   0.12   0.12   0.27 
  1024   6.8800e-04   8.6000e-05   23.81   0.12   0.12   0.27 
  2048   3.6400e-04   9.1000e-05   45.01   0.10   0.08   0.23 
  4096   1.9800e-04   9.9000e-05   82.75   0.10   0.07   0.24 
  8192   1.1920e-04   1.1920e-04   137.45   0.08   0.06   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   1   0   2   3   8 
  16   1   0   2   3   8 
  32   1   0   2   3   8 
  64   1   0   2   3   8 
  128   1   0   2   3   7 
  256   0   1   3   2   10 
  512   0   1   2   3   10 
  1024   0   1   2   3   7 
  2048   1   0   2   3   10 
  4096   1   0   2   3   7 
  8192   0   10   1   2   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   4 
  16    2   2   4 
  32    1   2   4 
  64    2   2   4 
  128    2   2   4 
  256    2   2   4 
  512    2   4   9 
  1024    2   4   9 
  2048    2   4   11 
  4096    1   4   11 
  8192    1   5   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.4014e-02   2.3452e-05   0.68   0.56   0.60   1.29 
  16   1.2072e-02   2.3579e-05   1.36   0.55   0.59   1.28 
  32   5.9277e-03   2.3155e-05   2.76   0.56   0.60   1.32 
  64   3.4693e-03   2.7104e-05   4.72   0.50   0.51   1.16 
  128   1.9358e-03   3.0247e-05   8.46   0.43   0.47   0.92 
  256   1.1799e-03   3.6873e-05   13.89   0.33   0.36   0.71 
  512   1.3439e-03   8.3996e-05   12.19   0.13   0.12   0.28 
  1024   6.7794e-04   8.4743e-05   24.17   0.12   0.11   0.28 
  2048   3.4876e-04   8.7190e-05   46.98   0.11   0.09   0.26 
  4096   1.8538e-04   9.2690e-05   88.38   0.10   0.06   0.25 
  8192   1.0318e-04   1.0318e-04   158.79   0.09   0.04   0.26 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   2   3   8 
  16   1   0   2   3   9 
  32   1   0   2   3   9 
  64   0   1   3   2   8 
  128   0   1   3   2   7 
  256   0   1   3   2   7 
  512   1   0   2   3   10 
  1024   0   1   2   3   10 
  2048   1   0   2   3   10 
  4096   1   0   2   3   7 
  8192   1   3   0   7   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   4 
  16    2   2   4 
  32    2   2   4 
  64    1   2   4 
  128    1   2   4 
  256    2   2   4 
  512    1   4   8 
  1024    2   4   8 
  2048    2   4   9 
  4096    1   4   11 
  8192    2   7   10 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.3928e-02   2.3368e-05   0.68   0.35   0.07   1.09 
  16   1.1852e-02   2.3148e-05   1.38   0.37   0.09   1.10 
  32   6.0834e-03   2.3763e-05   2.69   0.32   0.07   1.05 
  64   3.5602e-03   2.7814e-05   4.60   0.29   0.07   0.94 
  128   1.9630e-03   3.0672e-05   8.35   0.28   0.08   0.89 
  256   1.2174e-03   3.8044e-05   13.46   0.23   0.13   0.70 
  512   1.4176e-03   8.8600e-05   11.56   0.07   0.04   0.24 
  1024   7.5840e-04   9.4800e-05   21.60   0.06   0.03   0.20 
  2048   4.3020e-04   1.0755e-04   38.08   0.06   0.07   0.16 
  4096   2.6740e-04   1.3370e-04   61.27   0.08   0.09   0.14 
  8192   1.9660e-04   1.9660e-04   83.34   0.07   0.04   0.20 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   1   0   4   2   5 
  16   0   1   4   2   3 
  32   1   0   4   2   3 
  64   1   0   4   2   3 
  128   0   2   4   1   3 
  256   0   1   4   2   5 
  512   1   0   4   2   5 
  1024   0   2   4   3   5 
  2048   2   0   4   3   5 
  4096   2   0   4   5   9 
  8192   2   4   3   5   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   4   6 
  16    1   2   6 
  32    2   4   6 
  64    1   4   6 
  128    1   1   6 
  256    1   2   6 
  512    2   6   11 
  1024    2   6   11 
  2048    2   4   11 
  4096    1   3   11 
  8192    1   7   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.3503e-02   2.2952e-05   0.70   0.36   0.08   1.09 
  16   1.1731e-02   2.2912e-05   1.40   0.36   0.09   1.10 
  32   5.8134e-03   2.2709e-05   2.82   0.36   0.09   1.12 
  64   3.3888e-03   2.6475e-05   4.83   0.32   0.09   1.08 
  128   1.8900e-03   2.9531e-05   8.67   0.30   0.10   0.97 
  256   1.1574e-03   3.6169e-05   14.16   0.23   0.08   0.70 
  512   1.3458e-03   8.4113e-05   12.17   0.08   0.03   0.27 
  1024   6.8620e-04   8.5775e-05   23.88   0.08   0.04   0.25 
  2048   3.6320e-04   9.0800e-05   45.11   0.06   0.03   0.24 
  4096   1.9760e-04   9.8800e-05   82.91   0.06   0.05   0.18 
  8192   1.1460e-04   1.1460e-04   142.97   0.06   0.06   0.22 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   4   2   5 
  16   0   1   4   2   5 
  32   0   1   4   2   3 
  64   0   1   4   2   3 
  128   0   1   2   4   3 
  256   0   1   4   2   5 
  512   0   1   4   3   2 
  1024   1   0   2   4   3 
  2048   1   0   2   4   5 
  4096   0   1   3   2   4 
  8192   4   3   2   0   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   3   6 
  16    1   3   6 
  32    1   2   6 
  64    1   2   6 
  128    1   2   6 
  256    1   2   6 
  512    2   6   10 
  1024    2   6   10 
  2048    3   6   11 
  4096    1   6   11 
  8192    1   5   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.4425e-02   2.3853e-05   0.67   0.42   0.23   1.07 
  16   1.2190e-02   2.3809e-05   1.34   0.43   0.27   1.07 
  32   6.0013e-03   2.3443e-05   2.73   0.43   0.23   1.09 
  64   3.5389e-03   2.7648e-05   4.63   0.39   0.22   1.01 
  128   1.9555e-03   3.0554e-05   8.38   0.36   0.23   0.91 
  256   1.1702e-03   3.6569e-05   14.00   0.30   0.22   0.72 
  512   1.3673e-03   8.5459e-05   11.98   0.11   0.09   0.26 
  1024   6.8918e-04   8.6147e-05   23.77   0.11   0.09   0.25 
  2048   3.5008e-04   8.7520e-05   46.80   0.09   0.07   0.24 
  4096   1.8632e-04   9.3160e-05   87.93   0.07   0.04   0.25 
  8192   1.0116e-04   1.0116e-04   161.96   0.05   0.03   0.25 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   2   3   4 
  16   0   1   4   2   3 
  32   0   1   2   4   5 
  64   0   1   2   4   5 
  128   0   1   5   4   3 
  256   0   1   2   4   3 
  512   0   1   2   4   5 
  1024   0   1   4   2   3 
  2048   0   1   4   2   3 
  4096   1   0   4   2   5 
  8192   2   5   3   0   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    1   2   6 
  16    1   2   4 
  32    1   2   6 
  64    1   2   6 
  128    2   2   6 
  256    1   2   6 
  512    2   2   10 
  1024    2   2   11 
  2048    2   3   11 
  4096    1   6   11 
  8192    3   9   10 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:04:45 EDT.
86400 accesses since 1/2/96.