PSTSWM AlphaSC-667 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(unordered swap of 2MB message using MPI between two nodes)

(performance measured per processor when all processors in node communicating)

Date/Person: July 17, 2000 / P. Worley
Platform: Compaq AlphaServer SC at Oak Ridge National Laboratory (falcon.ccs.ornl.gov):
     64 ES40 4-way SMP nodes (667 MHz Alpha 21264a with 8MB L2 cache)
Environment: SC System v1.0; Digital UNIX V5.0;   RMS 2.37
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 4 nodes
1 and 5
2 and 6
3 and 7
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered simple swap
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 39.10 25.13 10.4%
1 iter. 38.81 30.75 29.9%
10 iter. 39.89 28.23 3.1%

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.76 18.74 6.9%
1 iter. 38.77 17.78 5.2%
10 iter. 38.98 19.93 0.7%
cache inv. w/overlap 39.05 33.28 7.5%
1 iter. w/overlap 40.45 33.84 8.2%
10 iter. w/overlap 39.92 33.38 2.3%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.98 20.84 2.5%
1 iter. 38.98 21.65 1.9%
10 iter. 39.11 21.16 0.6%
cache inv. w/overlap 38.97 23.84 2.0%
1 iter. w/overlap 38.98 23.69 1.8%
10 iter. w/overlap 39.16 21.88 1.0%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.98 20.39 1.1%
1 iter. 38.97 20.68 0.6%
10 iter. 39.15 21.58 0.8%
cache inv. w/overlap 39.10 20.16 1.3%
1 iter. w/overlap 39.11 20.36 0.9%
10 iter. w/overlap 39.91 23.33 1.9%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.88 45.15 1.7%
1 iter. 38.93 44.59 1.6%
10 iter. 39.13 44.41 1.0%
cache inv. w/overlap 38.99 22.70 1.3%
1 iter. w/overlap 39.01 22.77 1.4%
10 iter. w/overlap 39.15 21.48 0.8%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.94 43.31 1.1%
1 iter. 38.94 43.59 1.0%
10 iter. 39.13 43.54 0.9%
cache inv. w/overlap 39.11 20.63 1.6%
1 iter. w/overlap 39.26 21.09 1.7%
10 iter. w/overlap 39.34 22.95 0.8%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.93 21.36 1.9%
1 iter. 38.95 20.51 1.8%
10 iter. 39.07 21.02 0.7%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.99 21.14 1.2%
1 iter. 38.97 20.45 1.4%
10 iter. 39.11 19.30 1.3%
cache inv. w/overlap 38.95 25.35 1.5%
1 iter. w/overlap 38.86 25.91 1.1%
10 iter. w/overlap 39.09 26.01 1.0%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 38.98 20.92 0.8%
1 iter. 38.97 20.69 0.6%
10 iter. 39.13 20.83 0.4%
cache inv. w/overlap 39.00 23.13 1.5%
1 iter. w/overlap 38.99 22.99 1.4%
10 iter. w/overlap 39.15 21.77 0.9%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 39.02 21.08 0.6%
1 iter. 38.97 21.04 0.6%
10 iter. 39.14 20.44 0.3%
cache inv. w/overlap 39.02 20.33 1.1%
1 iter. w/overlap 39.30 20.30 1.6%
10 iter. w/overlap 39.49 23.21 0.9%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2803e-01   1.2503e-04   32.76   0.05   0.01   0.19 
  4096   1.1759e-01   2.2968e-04   35.67   0.03   0.01   0.10 
  8192   1.1256e-01   4.3968e-04   37.26   0.01   0.01   0.05 
  16384   1.1016e-01   8.6062e-04   38.07   0.01   0.00   0.02 
  32768   1.0840e-01   1.6937e-03   38.69   0.01   0.00   0.01 
  65536   1.0728e-01   3.3526e-03   39.10   0.01   0.01   0.01 
  131072   1.0739e-01   6.7121e-03   39.06   0.00   0.00   0.01 
  262144   1.0750e-01   1.3437e-02   39.02   0.00   0.00   0.02 
  524288   1.0818e-01   2.7046e-02   38.77   0.01   0.01   0.05 
  1048576   1.0789e-01   5.3946e-02   38.87   0.02   0.01   0.07 
  2097152   1.0783e-01   1.0783e-01   38.90   0.02   0.00   0.11 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   3   2   9   8   6 
  4096   3   2   9   8   6 
  8192   9   2   3   6   8 
  16384   3   9   2   8   6 
  32768   7   6   2   9   8 
  65536   0   7   9   3   8 
  131072   0   7   9   2   8 
  262144   9   7   8   3   2 
  524288   9   5   4   8   7 
  1048576   5   9   3   4   8 
  2097152   9   5   3   2   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    6   7   10 
  4096    5   8   10 
  8192    6   10   10 
  16384    7   10   10 
  32768    7   10   10 
  65536    7   10   10 
  131072    10   10   10 
  262144    9   10   10 
  524288    6   10   10 
  1048576    6   8   10 
  2097152    8   8   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2812e-01   1.2511e-04   32.74   0.05   0.01   0.18 
  4096   1.1753e-01   2.2955e-04   35.69   0.03   0.01   0.10 
  8192   1.1259e-01   4.3979e-04   37.25   0.01   0.01   0.05 
  16384   1.1012e-01   8.6028e-04   38.09   0.01   0.00   0.02 
  32768   1.0860e-01   1.6969e-03   38.62   0.00   0.00   0.01 
  65536   1.0787e-01   3.3708e-03   38.88   0.00   0.00   0.01 
  131072   1.0762e-01   6.7261e-03   38.97   0.01   0.00   0.12 
  262144   1.0760e-01   1.3450e-02   38.98   0.02   0.00   0.20 
  524288   1.0805e-01   2.7012e-02   38.82   0.05   0.00   0.43 
  1048576   1.0791e-01   5.3953e-02   38.87   0.03   0.01   0.26 
  2097152   1.0776e-01   1.0776e-01   38.92   0.02   0.00   0.15 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   3   6   8   1   9 
  4096   3   9   6   8   2 
  8192   9   3   2   6   8 
  16384   8   3   2   9   6 
  32768   7   6   2   3   8 
  65536   7   6   9   3   8 
  131072   7   8   6   9   3 
  262144   2   9   3   8   6 
  524288   3   4   9   5   8 
  1048576   8   5   9   4   3 
  2097152   3   8   4   5   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    6   7   10 
  4096    5   8   10 
  8192    6   10   10 
  16384    7   10   10 
  32768    7   10   10 
  65536    10   10   10 
  131072    9   9   10 
  262144    9   9   10 
  524288    6   9   9 
  1048576    5   9   9 
  2097152    7   8   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2775e-01   1.2476e-04   32.83   0.05   0.01   0.19 
  4096   1.1726e-01   2.2903e-04   35.77   0.03   0.01   0.10 
  8192   1.1226e-01   4.3851e-04   37.36   0.01   0.01   0.05 
  16384   1.0992e-01   8.5879e-04   38.16   0.01   0.00   0.02 
  32768   1.0826e-01   1.6915e-03   38.74   0.01   0.00   0.02 
  65536   1.0768e-01   3.3650e-03   38.95   0.00   0.00   0.01 
  131072   1.0731e-01   6.7068e-03   39.09   0.00   0.00   0.00 
  262144   1.0558e-01   1.3197e-02   39.73   0.02   0.02   0.02 
  524288   1.0524e-01   2.6311e-02   39.85   0.02   0.02   0.03 
  1048576   1.0516e-01   5.2579e-02   39.89   0.02   0.02   0.03 
  2097152   1.0591e-01   1.0591e-01   39.60   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   9   6   8   2   3 
  4096   3   9   6   2   8 
  8192   3   9   6   8   2 
  16384   3   6   9   8   2 
  32768   7   3   6   9   8 
  65536   7   8   3   9   2 
  131072   7   2   3   6   9 
  262144   0   7   2   8   9 
  524288   0   8   4   9   2 
  1048576   0   8   9   4   5 
  2097152   0   3   9   5   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    7   7   10 
  4096    5   8   10 
  8192    7   10   10 
  16384    7   10   10 
  32768    7   10   10 
  65536    10   10   10 
  131072    10   10   10 
  262144    1   10   10 
  524288    1   10   10 
  1048576    1   10   10 
  2097152    1   10   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2769e-01   1.2470e-04   32.85   0.03   0.02   0.09 
  4096   1.1737e-01   2.2923e-04   35.74   0.01   0.00   0.04 
  8192   1.1258e-01   4.3975e-04   37.26   0.01   0.00   0.02 
  16384   1.1022e-01   8.6112e-04   38.05   0.00   0.00   0.01 
  32768   1.0871e-01   1.6986e-03   38.58   0.00   0.00   0.01 
  65536   1.0726e-01   3.3520e-03   39.10   0.01   0.01   0.01 
  131072   1.0724e-01   6.7027e-03   39.11   0.00   0.00   0.01 
  262144   1.0746e-01   1.3433e-02   39.03   0.00   0.00   0.00 
  524288   1.0856e-01   2.7141e-02   38.63   0.01   0.00   0.04 
  1048576   1.0786e-01   5.3932e-02   38.89   0.01   0.01   0.04 
  2097152   1.0775e-01   1.0775e-01   38.93   0.02   0.00   0.15 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   3   9   5   4   8 
  4096   3   9   2   5   4 
  8192   3   9   2   5   8 
  16384   8   2   4   6   9 
  32768   9   3   8   4   2 
  65536   3   0   9   5   1 
  131072   5   1   3   9   4 
  262144   3   9   8   4   0 
  524288   2   4   9   3   8 
  1048576   8   4   2   3   5 
  2097152   3   5   4   2   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   8   10 
  4096    7   10   10 
  8192    7   10   10 
  16384    8   10   10 
  32768    10   10   10 
  65536    10   10   10 
  131072    10   10   10 
  262144    10   10   10 
  524288    8   10   10 
  1048576    6   10   10 
  2097152    7   8   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2780e-01   1.2480e-04   32.82   0.03   0.02   0.09 
  4096   1.1739e-01   2.2928e-04   35.73   0.01   0.00   0.04 
  8192   1.1255e-01   4.3964e-04   37.27   0.01   0.00   0.02 
  16384   1.1035e-01   8.6210e-04   38.01   0.00   0.00   0.01 
  32768   1.0870e-01   1.6984e-03   38.59   0.00   0.00   0.01 
  65536   1.0724e-01   3.3514e-03   39.11   0.01   0.01   0.01 
  131072   1.0684e-01   6.6775e-03   39.26   0.02   0.01   0.15 
  262144   1.0673e-01   1.3341e-02   39.30   0.04   0.01   0.34 
  524288   1.0369e-01   2.5922e-02   40.45   0.08   0.05   0.42 
  1048576   1.0797e-01   5.3986e-02   38.85   0.04   0.01   0.36 
  2097152   1.0779e-01   1.0779e-01   38.91   0.02   0.00   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   9   3   5   4   8 
  4096   5   9   3   4   2 
  8192   9   5   3   2   4 
  16384   2   8   4   3   5 
  32768   8   5   2   3   9 
  65536   1   3   9   5   8 
  131072   5   1   3   9   8 
  262144   9   5   3   4   8 
  524288   1   3   4   8   9 
  1048576   2   5   8   4   3 
  2097152   5   9   8   2   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   8   10 
  4096    7   10   10 
  8192    7   10   10 
  16384    7   10   10 
  32768    10   10   10 
  65536    9   10   10 
  131072    8   9   10 
  262144    7   9   9 
  524288    1   7   9 
  1048576    7   9   9 
  2097152    8   9   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2823e-01   1.2522e-04   32.71   0.02   0.01   0.08 
  4096   1.1718e-01   2.2886e-04   35.79   0.01   0.00   0.04 
  8192   1.1237e-01   4.3893e-04   37.33   0.01   0.00   0.02 
  16384   1.1009e-01   8.6006e-04   38.10   0.00   0.00   0.02 
  32768   1.0833e-01   1.6927e-03   38.72   0.00   0.00   0.01 
  65536   1.0726e-01   3.3518e-03   39.10   0.00   0.00   0.01 
  131072   1.0677e-01   6.6730e-03   39.28   0.00   0.01   0.01 
  262144   1.0535e-01   1.3169e-02   39.81   0.02   0.02   0.02 
  524288   1.0441e-01   2.6103e-02   40.17   0.02   0.03   0.03 
  1048576   1.0510e-01   5.2548e-02   39.91   0.02   0.02   0.02 
  2097152   1.0259e-01   1.0259e-01   40.88   0.04   0.04   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   4   2   8   5   9 
  4096   2   4   8   5   9 
  8192   9   3   5   4   2 
  16384   4   2   9   8   3 
  32768   3   5   9   2   8 
  65536   3   9   5   4   2 
  131072   5   9   3   1   0 
  262144   0   1   5   3   4 
  524288   0   3   1   9   5 
  1048576   3   1   0   5   9 
  2097152   0   1   3   9   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    5   8   10 
  4096    7   10   10 
  8192    7   10   10 
  16384    7   10   10 
  32768    8   10   10 
  65536    10   10   10 
  131072    10   10   10 
  262144    1   10   10 
  524288    1   10   10 
  1048576    3   10   10 
  2097152    1   10   10 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:05:03 EDT.
87039 accesses since 1/2/96.