PSTSWM AlphaSC-1000 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(unordered swap of 2MB message using MPI between two nodes)

Date/Person: January 3, 2002 / P. Worley
Platform: Compaq AlphaServer SC at Pittsburgh Supercomputer Center (lemieux.psc.edu):
     750 ES45 4-way SMP nodes (1.0 GHz Alpha 21264C with 8MB L2 cache)
Environment: SC System TS2.5; Digital UNIX V5.1;   RMS X.XX
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 4, each on different (logically neighboring) nodes
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 242.81 14.70 3.4%
1 iter. 242.37 13.48 3.7%
10 iter. 246.17 13.53 2.6%
cache inv. w/overlap 252.20 12.66 4.1%
1 iter. w/overlap 253.93 13.53 4.6%
10 iter. w/overlap 254.56 12.52 2.9%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 253.50 13.09 1.4%
1 iter. 253.94 14.47 4.9%
10 iter. 253.88 14.61 6.4%
cache inv. w/overlap 253.19 13.80 2.1%
1 iter. w/overlap 253.25 13.66 2.0%
10 iter. w/overlap 254.12 14.47 2.4%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 253.85 14.04 3.4%
1 iter. 253.32 13.31 1.2%
10 iter. 253.90 14.30 4.1%
cache inv. w/overlap 253.25 10.99 4.7%
1 iter. w/overlap 253.26 10.76 5.1%
10 iter. w/overlap 254.10 13.53 4.5%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 253.96 21.41 2.0%
1 iter. 252.88 21.37 3.3%
10 iter. 253.41 21.64 3.3%
cache inv. w/overlap 252.98 13.18 1.7%
1 iter. w/overlap 253.58 13.33 1.1%
10 iter. w/overlap 254.07 14.62 3.5%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 253.09 21.62 2.7%
1 iter. 253.32 21.14 3.0%
10 iter. 253.78 21.24 2.9%
cache inv. w/overlap 255.58 11.33 5.8%
1 iter. w/overlap 253.76 12.33 9.8%
10 iter. w/overlap 253.90 13.54 4.5%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 252.92 14.66 6.3%
1 iter. 252.92 15.11 6.9%
10 iter. 253.75 14.33 5.3%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 242.21 14.18 4.1%
1 iter. 242.61 13.11 3.6%
10 iter. 245.99 13.60 2.3%
cache inv. w/overlap 252.36 15.26 6.6%
1 iter. w/overlap 253.84 14.99 5.7%
10 iter. w/overlap 254.38 12.79 4.6%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 253.43 14.73 6.1%
1 iter. 253.56 14.88 6.6%
10 iter. 253.60 14.86 6.6%
cache inv. w/overlap 253.94 14.25 2.8%
1 iter. w/overlap 253.29 14.38 3.0%
10 iter. w/overlap 254.11 14.42 2.3%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 253.07 14.16 4.2%
1 iter. 253.37 15.04 5.8%
10 iter. 253.43 14.45 4.6%
cache inv. w/overlap 253.19 11.12 4.8%
1 iter. w/overlap 253.51 10.39 3.1%
10 iter. w/overlap 254.39 13.50 4.4%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.9862e-02   2.9162e-05   140.46   0.08   0.01   0.27 
  4096   2.2665e-02   4.4268e-05   185.05   0.06   0.02   0.20 
  8192   1.9577e-02   7.6472e-05   214.25   0.05   0.03   0.13 
  16384   1.8096e-02   1.4138e-04   231.78   0.03   0.02   0.08 
  32768   1.6992e-02   2.6550e-04   246.84   0.03   0.03   0.06 
  65536   1.6976e-02   5.3049e-04   247.08   0.01   0.01   0.03 
  131072   1.6722e-02   1.0451e-03   250.83   0.01   0.01   0.04 
  262144   1.6652e-02   2.0816e-03   251.87   0.01   0.00   0.04 
  524288   1.6584e-02   4.1461e-03   252.91   0.01   0.01   0.05 
  1048576   1.6569e-02   8.2843e-03   253.15   0.01   0.00   0.05 
  2097152   1.6513e-02   1.6513e-02   254.00   0.01   0.00   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   3   9   6   8 
  4096   6   8   9   3   2 
  8192   6   8   3   9   2 
  16384   6   9   8   2   3 
  32768   6   2   9   3   8 
  65536   3   6   9   8   2 
  131072   3   2   6   8   9 
  262144   9   6   8   2   3 
  524288   8   6   3   9   4 
  1048576   2   9   6   3   4 
  2097152   8   6   3   5   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   5   7 
  4096    3   5   9 
  8192    3   5   9 
  16384    3   7   9 
  32768    2   7   9 
  65536    5   9   9 
  131072    5   9   9 
  262144    7   9   9 
  524288    7   8   9 
  1048576    7   9   9 
  2097152    7   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.9982e-02   2.9279e-05   139.89   0.07   0.02   0.25 
  4096   2.2663e-02   4.4264e-05   185.07   0.06   0.02   0.18 
  8192   1.9693e-02   7.6925e-05   212.99   0.04   0.01   0.13 
  16384   1.8049e-02   1.4101e-04   232.38   0.03   0.01   0.07 
  32768   1.7157e-02   2.6807e-04   244.47   0.02   0.02   0.05 
  65536   1.6983e-02   5.3073e-04   246.97   0.01   0.00   0.02 
  131072   1.6753e-02   1.0471e-03   250.36   0.01   0.01   0.04 
  262144   1.6671e-02   2.0839e-03   251.59   0.01   0.00   0.04 
  524288   1.6541e-02   4.1354e-03   253.56   0.01   0.01   0.05 
  1048576   1.6586e-02   8.2932e-03   252.88   0.01   0.00   0.05 
  2097152   1.6539e-02   1.6539e-02   253.60   0.06   0.00   0.45 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   3   2   8   6   9 
  4096   8   6   2   9   3 
  8192   8   3   2   6   9 
  16384   2   6   3   8   9 
  32768   2   3   6   8   9 
  65536   3   8   9   2   6 
  131072   8   2   3   6   9 
  262144   2   5   9   8   3 
  524288   8   3   4   6   5 
  1048576   4   2   5   8   3 
  2097152   8   6   4   3   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   6   8 
  4096    3   5   9 
  8192    5   5   9 
  16384    4   7   9 
  32768    1   9   9 
  65536    5   9   9 
  131072    6   9   9 
  262144    7   9   9 
  524288    7   8   9 
  1048576    7   9   9 
  2097152    7   8   8 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   3.0000e-02   2.9296e-05   139.81   0.07   0.01   0.26 
  4096   2.2547e-02   4.4038e-05   186.02   0.06   0.02   0.19 
  8192   1.9731e-02   7.7074e-05   212.57   0.04   0.01   0.11 
  16384   1.8157e-02   1.4185e-04   231.01   0.02   0.01   0.06 
  32768   1.6986e-02   2.6541e-04   246.92   0.03   0.03   0.06 
  65536   1.7044e-02   5.3261e-04   246.09   0.01   0.00   0.02 
  131072   1.6759e-02   1.0474e-03   250.27   0.01   0.00   0.02 
  262144   1.6629e-02   2.0787e-03   252.22   0.01   0.00   0.03 
  524288   1.6577e-02   4.1443e-03   253.02   0.01   0.00   0.03 
  1048576   1.6540e-02   8.2702e-03   253.58   0.01   0.00   0.03 
  2097152   1.6523e-02   1.6523e-02   253.85   0.01   0.00   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   3   8   9 
  4096   2   8   6   9   3 
  8192   2   8   6   3   9 
  16384   6   2   3   8   9 
  32768   2   6   3   1   9 
  65536   3   9   8   6   2 
  131072   6   2   8   3   9 
  262144   6   9   8   2   3 
  524288   6   8   9   2   3 
  1048576   6   2   9   3   8 
  2097152   3   8   9   2   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    5   7   7 
  4096    3   5   9 
  8192    5   5   9 
  16384    5   7   9 
  32768    2   7   9 
  65536    7   9   9 
  131072    6   9   9 
  262144    7   9   9 
  524288    7   9   9 
  1048576    7   9   9 
  2097152    7   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.6791e-02   2.6163e-05   156.56   0.10   0.14   0.17 
  4096   2.0991e-02   4.0998e-05   199.81   0.08   0.10   0.15 
  8192   1.8938e-02   7.3975e-05   221.48   0.03   0.04   0.07 
  16384   1.7857e-02   1.3951e-04   234.89   0.02   0.02   0.05 
  32768   1.6643e-02   2.6004e-04   252.02   0.04   0.03   0.06 
  65536   1.6621e-02   5.1939e-04   252.36   0.01   0.01   0.02 
  131072   1.6634e-02   1.0396e-03   252.15   0.01   0.01   0.01 
  262144   1.6610e-02   2.0762e-03   252.52   0.00   0.00   0.01 
  524288   1.6411e-02   4.1028e-03   255.58   0.01   0.01   0.03 
  1048576   1.6566e-02   8.2830e-03   253.19   0.01   0.00   0.04 
  2097152   1.6519e-02   1.6519e-02   253.91   0.01   0.00   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   5   3   9   2   8 
  4096   5   3   9   8   6 
  8192   3   9   5   7   2 
  16384   7   5   9   3   2 
  32768   7   6   9   5   3 
  65536   7   1   9   3   5 
  131072   7   1   5   3   9 
  262144   9   5   2   8   3 
  524288   5   9   6   8   2 
  1048576   2   4   5   9   3 
  2097152   5   2   3   4   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   3   9 
  4096    2   3   9 
  8192    3   6   9 
  16384    4   9   9 
  32768    1   7   9 
  65536    2   9   9 
  131072    7   9   9 
  262144    8   9   9 
  524288    1   9   9 
  1048576    7   9   9 
  2097152    7   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.6517e-02   2.5895e-05   158.18   0.10   0.13   0.15 
  4096   2.0810e-02   4.0644e-05   201.56   0.08   0.11   0.13 
  8192   1.8707e-02   7.3076e-05   224.21   0.04   0.05   0.07 
  16384   1.7534e-02   1.3698e-04   239.22   0.02   0.03   0.04 
  32768   1.6725e-02   2.6133e-04   250.78   0.03   0.03   0.05 
  65536   1.6518e-02   5.1618e-04   253.93   0.02   0.02   0.03 
  131072   1.6636e-02   1.0397e-03   252.13   0.01   0.01   0.01 
  262144   1.6545e-02   2.0682e-03   253.50   0.01   0.01   0.01 
  524288   1.6552e-02   4.1379e-03   253.41   0.00   0.00   0.02 
  1048576   1.6529e-02   8.2643e-03   253.76   0.01   0.00   0.04 
  2097152   1.6527e-02   1.6527e-02   253.79   0.82   0.00   7.34 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   3   9   5   4   2 
  4096   5   3   9   7   2 
  8192   5   3   9   7   8 
  16384   7   3   9   5   6 
  32768   7   6   3   9   5 
  65536   1   7   9   5   3 
  131072   7   1   9   3   5 
  262144   9   5   3   2   4 
  524288   6   4   3   5   9 
  1048576   5   6   9   2   4 
  2097152   2   9   5   3   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   3   9 
  4096    2   3   9 
  8192    1   4   9 
  16384    1   9   9 
  32768    1   9   9 
  65536    2   9   9 
  131072    8   9   9 
  262144    7   9   9 
  524288    8   9   9 
  1048576    7   9   9 
  2097152    7   8   8 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.9334e-02   2.8646e-05   142.99   0.02   0.02   0.05 
  4096   2.2417e-02   4.3783e-05   187.10   0.03   0.03   0.05 
  8192   1.9440e-02   7.5938e-05   215.75   0.02   0.02   0.04 
  16384   1.7561e-02   1.3720e-04   238.84   0.03   0.03   0.05 
  32768   1.6546e-02   2.5853e-04   253.50   0.04   0.05   0.06 
  65536   1.6476e-02   5.1489e-04   254.56   0.02   0.03   0.03 
  131072   1.6529e-02   1.0331e-03   253.76   0.01   0.01   0.01 
  262144   1.6529e-02   2.0661e-03   253.76   0.00   0.01   0.01 
  524288   1.6548e-02   4.1369e-03   253.47   0.00   0.00   0.00 
  1048576   1.6528e-02   8.2639e-03   253.77   0.00   0.00   0.00 
  2097152   1.6498e-02   1.6498e-02   254.24   0.00   0.00   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   9   3   5   1   7 
  4096   3   9   5   6   4 
  8192   9   5   3   7   6 
  16384   7   1   9   5   3 
  32768   7   6   1   9   3 
  65536   1   7   9   3   5 
  131072   1   7   5   9   3 
  262144   1   7   5   9   3 
  524288   3   9   5   8   1 
  1048576   5   9   1   3   8 
  2097152   5   9   3   2   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   9   9 
  4096    3   9   9 
  8192    4   9   9 
  16384    1   9   9 
  32768    1   6   9 
  65536    2   9   9 
  131072    2   9   9 
  262144    9   9   9 
  524288    9   9   9 
  1048576    9   9   9 
  2097152    9   9   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:01:36 EDT.
86553 accesses since 1/2/96.