PSTSWM AlphaSC-667 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(ordered swap of 2MB message using MPI within a node)

(performance measured per processor when all processors in node communicating)

r>
Date/Person: July 17, 2000 / P. Worley
Platform: Compaq AlphaServer SC at Oak Ridge National Laboratory (falcon.ccs.ornl.gov):
     64 ES40 4-way SMP nodes (667 MHz Alpha 21264a with 8MB L2 cache)
Environment: SC System v1.0; Digital UNIX V5.0;   RMS 2.37
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1
2 and 3
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 318.22 40.04 12.3%
1 iter. 508.83 40.26 17.4%
10 iter. 499.09 41.21 15.9%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 319.42 41.00 13.8%
1 iter. 506.44 41.38 19.5%
10 iter. 501.28 41.24 15.0%
cache inv. w/overlap 317.83 40.19 16.5%
1 iter. w/overlap 501.95 40.84 27.6%
10 iter. w/overlap 505.94 41.88 13.3%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 314.35 40.65 12.7%
1 iter. 500.99 41.30 14.9%
10 iter. 499.86 42.16 15.4%
cache inv. w/overlap 319.69 41.24 16.9%
1 iter. w/overlap 509.82 40.93 17.9%
10 iter. w/overlap 506.45 44.23 15.2%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 317.14 41.39 11.8%
1 iter. 509.41 41.56 16.2%
10 iter. 501.45 41.56 13.3%
cache inv. w/overlap 320.41 42.00 13.9%
1 iter. w/overlap 511.00 41.54 17.5%
10 iter. w/overlap 504.80 44.43 12.9%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 318.86 51.81 14.9%
1 iter. 510.31 51.63 12.0%
10 iter. 498.43 52.45 12.3%
cache inv. w/overlap 319.44 42.21 13.2%
1 iter. w/overlap 499.13 41.11 15.0%
10 iter. w/overlap 507.79 44.00 16.3%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 315.29 51.63 13.8%
1 iter. 499.83 52.38 15.1%
10 iter. 502.14 52.39 11.9%
cache inv. w/overlap 317.59 41.78 13.2%
1 iter. w/overlap 511.05 41.77 28.7%
10 iter. w/overlap 505.73 44.13 13.5%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 320.88 52.08 17.7%
1 iter. 500.99 51.76 13.4%
10 iter. 505.53 51.67 14.3%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 320.44 46.33 19.8%
1 iter. 502.25 47.17 19.0%
10 iter. 499.22 46.60 20.6%
cache inv. w/overlap 320.93 45.31 20.6%
1 iter. w/overlap 506.00 45.24 18.3%
10 iter. w/overlap 502.47 46.28 18.9%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 318.98 45.26 17.9%
1 iter. 507.91 46.88 21.2%
10 iter. 500.95 47.24 21.5%
cache inv. w/overlap 322.60 45.64 18.3%
1 iter. w/overlap 502.58 45.52 14.5%
10 iter. w/overlap 502.59 49.53 22.0%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 318.81 45.85 17.7%
1 iter. 504.12 46.97 21.3%
10 iter. 501.25 46.80 20.2%
cache inv. w/overlap 319.44 45.45 18.2%
1 iter. w/overlap 502.78 46.25 26.4%
10 iter. w/overlap 500.16 49.25 17.6%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 317.39 46.84 22.9%
1 iter. 507.15 45.80 15.7%
10 iter. 501.84 45.90 21.1%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   9.2287e-02   9.0124e-05   45.45   0.09   0.07   0.22 
  4096   5.0298e-02   9.8239e-05   83.39   0.07   0.04   0.19 
  8192   2.9975e-02   1.1709e-04   139.93   0.06   0.03   0.21 
  16384   2.1161e-02   1.6532e-04   198.21   0.05   0.04   0.11 
  32768   1.9412e-02   3.0331e-04   216.07   0.02   0.02   0.10 
  65536   1.7880e-02   5.5876e-04   234.58   0.01   0.01   0.02 
  131072   1.5256e-02   9.5352e-04   274.92   0.02   0.02   0.05 
  262144   1.4327e-02   1.7909e-03   292.76   0.02   0.01   0.09 
  524288   1.3589e-02   3.3972e-03   308.66   0.02   0.01   0.07 
  1048576   1.3298e-02   6.6488e-03   315.42   0.01   0.01   0.03 
  2097152   1.3071e-02   1.3071e-02   320.88   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   1   0   2   3   7 
  4096   1   7   10   0   9 
  8192   1   0   10   7   3 
  16384   0   3   1   7   10 
  32768   7   8   3   1   10 
  65536   1   7   0   3   8 
  131072   0   2   6   8   1 
  262144   1   9   0   8   7 
  524288   0   3   1   9   5 
  1048576   1   8   7   0   9 
  2097152   6   7   1   8   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   4   11 
  4096    1   7   11 
  8192    3   8   11 
  16384    1   7   11 
  32768    3   10   11 
  65536    4   11   11 
  131072    1   11   11 
  262144    5   10   11 
  524288    4   8   11 
  1048576    6   11   11 
  2097152    7   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   9.0302e-02   8.8186e-05   46.45   0.11   0.09   0.26 
  4096   4.8098e-02   9.3941e-05   87.20   0.10   0.06   0.25 
  8192   2.6654e-02   1.0412e-04   157.36   0.10   0.06   0.26 
  16384   1.7159e-02   1.3405e-04   244.44   0.07   0.01   0.25 
  32768   1.4040e-02   2.1938e-04   298.74   0.09   0.06   0.18 
  65536   1.2941e-02   4.0441e-04   324.11   0.04   0.01   0.11 
  131072   1.0317e-02   6.4484e-04   406.53   0.06   0.03   0.15 
  262144   9.3450e-03   1.1681e-03   448.83   0.02   0.01   0.08 
  524288   8.7192e-03   2.1798e-03   481.04   0.02   0.02   0.05 
  1048576   8.3720e-03   4.1860e-03   500.99   0.02   0.03   0.04 
  2097152   8.2192e-03   8.2192e-03   510.31   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   1   2   3   10 
  4096   1   0   2   3   7 
  8192   1   0   10   3   2 
  16384   7   2   0   3   8 
  32768   0   7   10   6   4 
  65536   2   3   4   0   6 
  131072   3   0   4   10   2 
  262144   10   7   9   3   5 
  524288   1   10   2   0   5 
  1048576   6   2   7   3   4 
  2097152   4   3   0   8   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   4   10 
  4096    1   4   11 
  8192    1   5   10 
  16384    6   6   10 
  32768    1   2   11 
  65536    2   8   11 
  131072    3   6   11 
  262144    5   10   11 
  524288    3   10   11 
  1048576    2   11   11 
  2097152    6   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   8.9963e-02   8.7855e-05   46.62   0.11   0.09   0.25 
  4096   4.7730e-02   9.3222e-05   87.88   0.09   0.06   0.24 
  8192   2.6407e-02   1.0315e-04   158.83   0.09   0.05   0.25 
  16384   1.6355e-02   1.2778e-04   256.45   0.06   0.03   0.19 
  32768   1.3785e-02   2.1539e-04   304.27   0.05   0.05   0.12 
  65536   1.2613e-02   3.9415e-04   332.54   0.02   0.02   0.04 
  131072   1.0301e-02   6.4380e-04   407.18   0.02   0.02   0.08 
  262144   9.3180e-03   1.1647e-03   450.13   0.01   0.01   0.02 
  524288   8.6937e-03   2.1734e-03   482.45   0.01   0.01   0.03 
  1048576   8.3728e-03   4.1864e-03   500.95   0.02   0.02   0.03 
  2097152   8.2969e-03   8.2969e-03   505.53   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   1   0   3   2   10 
  4096   1   0   2   3   7 
  8192   0   1   2   7   3 
  16384   0   1   10   2   8 
  32768   0   2   10   8   3 
  65536   10   1   8   2   3 
  131072   3   9   1   7   5 
  262144   0   2   10   3   7 
  524288   0   2   10   6   8 
  1048576   8   6   10   2   0 
  2097152   6   5   10   3   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   4   9 
  4096    2   5   11 
  8192    1   7   11 
  16384    2   8   11 
  32768    1   4   11 
  65536    5   11   11 
  131072    4   10   11 
  262144    6   11   11 
  524288    5   11   11 
  1048576    3   11   11 
  2097152    6   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   9.1369e-02   8.9227e-05   45.91   0.07   0.04   0.23 
  4096   5.0215e-02   9.8076e-05   83.53   0.04   0.04   0.18 
  8192   2.9770e-02   1.1629e-04   140.89   0.05   0.03   0.18 
  16384   2.0881e-02   1.6313e-04   200.87   0.07   0.07   0.12 
  32768   1.9219e-02   3.0029e-04   218.24   0.06   0.04   0.15 
  65536   1.7751e-02   5.5471e-04   236.29   0.03   0.02   0.06 
  131072   1.5373e-02   9.6083e-04   272.83   0.02   0.01   0.05 
  262144   1.4380e-02   1.7975e-03   291.68   0.01   0.01   0.06 
  524288   1.3637e-02   3.4092e-03   307.57   0.01   0.01   0.03 
  1048576   1.3270e-02   6.6352e-03   316.06   0.01   0.01   0.03 
  2097152   1.3002e-02   1.3002e-02   322.60   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   1   0   2   4   3 
  4096   1   10   0   7   4 
  8192   0   7   3   4   8 
  16384   0   4   8   7   1 
  32768   4   0   8   5   1 
  65536   4   8   2   0   9 
  131072   9   0   2   8   6 
  262144   8   2   7   3   4 
  524288   8   3   9   5   6 
  1048576   2   6   8   1   9 
  2097152   8   6   7   3   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   6   11 
  4096    1   10   11 
  8192    2   8   11 
  16384    1   2   11 
  32768    3   6   11 
  65536    2   10   11 
  131072    5   11   11 
  262144    8   10   11 
  524288    8   11   11 
  1048576    8   11   11 
  2097152    8   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   8.8754e-02   8.6674e-05   47.26   0.07   0.03   0.25 
  4096   4.6929e-02   9.1658e-05   89.38   0.06   0.04   0.24 
  8192   2.6276e-02   1.0264e-04   159.63   0.05   0.04   0.22 
  16384   1.6963e-02   1.3252e-04   247.27   0.08   0.06   0.22 
  32768   1.4043e-02   2.1943e-04   298.67   0.10   0.05   0.30 
  65536   1.2643e-02   3.9510e-04   331.74   0.08   0.04   0.21 
  131072   1.0328e-02   6.4547e-04   406.13   0.07   0.03   0.20 
  262144   9.3256e-03   1.1657e-03   449.76   0.02   0.01   0.05 
  524288   8.6536e-03   2.1634e-03   484.69   0.03   0.02   0.05 
  1048576   8.3440e-03   4.1720e-03   502.67   0.02   0.02   0.03 
  2097152   8.0890e-03   8.0890e-03   518.52   0.02   0.02   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   1   0   2   4   5 
  4096   1   0   5   2   4 
  8192   0   1   7   2   5 
  16384   0   4   10   2   8 
  32768   0   4   10   2   8 
  65536   0   4   8   10   6 
  131072   6   0   10   8   7 
  262144   0   4   3   7   6 
  524288   2   0   4   8   10 
  1048576   5   2   8   6   3 
  2097152   0   5   3   6   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   6   11 
  4096    1   6   11 
  8192    2   7   11 
  16384    3   5   11 
  32768    1   6   9 
  65536    1   7   11 
  131072    1   8   11 
  262144    5   11   11 
  524288    2   10   11 
  1048576    4   11   11 
  2097152    1   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   8.9917e-02   8.7810e-05   46.65   0.09   0.08   0.24 
  4096   4.7605e-02   9.2978e-05   88.11   0.08   0.06   0.23 
  8192   2.6338e-02   1.0288e-04   159.25   0.07   0.06   0.22 
  16384   1.6300e-02   1.2734e-04   257.32   0.06   0.05   0.16 
  32768   1.3863e-02   2.1660e-04   302.56   0.06   0.05   0.14 
  65536   1.2357e-02   3.8615e-04   339.43   0.02   0.02   0.04 
  131072   1.0292e-02   6.4324e-04   407.53   0.03   0.05   0.06 
  262144   9.2126e-03   1.1516e-03   455.28   0.01   0.01   0.01 
  524288   8.5773e-03   2.1443e-03   489.00   0.04   0.01   0.09 
  1048576   8.3286e-03   4.1643e-03   503.60   0.03   0.02   0.06 
  2097152   8.2599e-03   8.2599e-03   507.79   0.01   0.00   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   1   4   2   5 
  4096   1   0   4   10   2 
  8192   0   1   7   10   4 
  16384   0   10   4   7   2 
  32768   0   10   4   2   8 
  65536   0   10   4   2   6 
  131072   1   3   5   7   9 
  262144   10   0   2   8   4 
  524288   0   6   10   8   2 
  1048576   6   2   10   8   4 
  2097152   4   2   1   0   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   2   11 
  4096    1   3   11 
  8192    1   5   11 
  16384    1   5   11 
  32768    2   6   11 
  65536    4   11   11 
  131072    5   6   11 
  262144    8   11   11 
  524288    5   6   11 
  1048576    3   9   11 
  2097152    8   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:04:21 EDT.
86402 accesses since 1/2/96.