PSTSWM AlphaSC-1000 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(unordered swap of 2MB message using MPI within a node)

(performance measured per processor when all processors in node communicating)

Date/Person: January 3, 2002 / P. Worley
Platform: Compaq AlphaServer SC at Pittsburgh Supercomputer Center (lemieux.psc.edu):
     750 ES45 4-way SMP nodes (1.0 GHz Alpha 21264C with 8MB L2 cache)
Environment: SC System TS2.5; Digital UNIX V5.1;   RMS X.XX
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1
2 and 3
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 430.85 66.08 76.9%
1 iter. 548.22 68.90 66.8%
10 iter. 598.02 69.91 65.7%
cache inv. w/overlap 436.79 67.45 81.2%
1 iter. w/overlap 552.11 70.04 67.8%
10 iter. w/overlap 596.69 72.52 69.9%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 450.25 75.85 93.9%
1 iter. 528.30 77.58 95.5%
10 iter. 597.21 77.20 85.6%
cache inv. w/overlap 440.55 40.23 34.8%
1 iter. w/overlap 538.38 40.73 30.7%
10 iter. w/overlap 599.96 47.19 40.1%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 440.67 72.43 88.7%
1 iter. 545.66 77.02 91.4%
10 iter. 590.63 78.36 86.6%
cache inv. w/overlap 440.38 39.51 29.4%
1 iter. w/overlap 554.73 40.81 26.5%
10 iter. w/overlap 592.25 47.95 44.3%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 433.62 87.69 60.6%
1 iter. 548.94 89.77 50.9%
10 iter. 584.65 91.28 65.9%
cache inv. w/overlap 444.66 39.20 32.6%
1 iter. w/overlap 551.10 41.32 28.0%
10 iter. w/overlap 597.50 46.80 39.9%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 447.61 84.89 54.1%
1 iter. 520.92 89.51 61.5%
10 iter. 584.96 89.95 65.7%
cache inv. w/overlap 443.48 40.18 34.2%
1 iter. w/overlap 540.18 41.21 29.3%
10 iter. w/overlap 598.52 47.85 41.9%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 448.75 76.49 95.8%
1 iter. 554.41 77.42 94.1%
10 iter. 594.98 76.79 83.7%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 428.38 62.55 56.5%
1 iter. 551.75 62.62 44.2%
10 iter. 597.37 62.51 54.4%
cache inv. w/overlap 441.31 76.92 61.2%
1 iter. w/overlap 552.52 71.35 53.2%
10 iter. w/overlap 596.70 71.33 66.0%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 449.11 61.79 52.4%
1 iter. 525.75 62.86 58.1%
10 iter. 596.92 62.79 61.6%
cache inv. w/overlap 445.22 63.27 53.0%
1 iter. w/overlap 534.35 62.94 58.2%
10 iter. w/overlap 599.15 65.82 68.1%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 441.31 62.27 49.3%
1 iter. 551.08 62.47 53.0%
10 iter. 596.92 62.80 62.2%
cache inv. w/overlap 441.78 53.23 36.0%
1 iter. w/overlap 547.49 52.49 40.9%
10 iter. w/overlap 593.99 54.31 50.0%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   6.4416e-02   6.2906e-05   65.11   0.11   0.06   0.36 
  4096   3.1163e-02   6.0864e-05   134.59   0.10   0.05   0.38 
  8192   1.4774e-02   5.7709e-05   283.91   0.13   0.12   0.37 
  16384   1.1890e-02   9.2892e-05   352.75   0.05   0.02   0.15 
  32768   1.0853e-02   1.6958e-04   386.46   0.02   0.01   0.06 
  65536   1.0169e-02   3.1779e-04   412.44   0.05   0.04   0.10 
  131072   1.0109e-02   6.3180e-04   414.92   0.01   0.01   0.02 
  262144   9.7424e-03   1.2178e-03   430.52   0.01   0.01   0.03 
  524288   9.6368e-03   2.4092e-03   435.24   0.03   0.02   0.08 
  1048576   9.5514e-03   4.7757e-03   439.13   0.02   0.01   0.04 
  2097152   9.4170e-03   9.4170e-03   445.40   0.02   0.01   0.09 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   8   9   7   1   3 
  4096   3   2   6   1   7 
  8192   6   2   3   1   7 
  16384   2   8   1   3   6 
  32768   9   7   6   3   8 
  65536   7   9   4   1   5 
  131072   3   2   6   4   9 
  262144   6   3   8   1   7 
  524288   6   2   8   5   3 
  1048576   2   9   8   5   3 
  2097152   7   6   3   5   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   4   7 
  4096    3   5   7 
  8192    3   4   7 
  16384    2   7   9 
  32768    5   7   9 
  65536    1   6   9 
  131072    7   9   9 
  262144    6   9   9 
  524288    2   6   9 
  1048576    5   9   9 
  2097152    3   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   6.4492e-02   6.2980e-05   65.04   0.13   0.11   0.38 
  4096   3.1554e-02   6.1628e-05   132.93   0.10   0.03   0.37 
  8192   1.4108e-02   5.5108e-05   297.31   0.17   0.16   0.48 
  16384   1.0094e-02   7.8861e-05   415.52   0.07   0.03   0.26 
  32768   9.0606e-03   1.4157e-04   462.92   0.05   0.04   0.15 
  65536   8.2598e-03   2.5812e-04   507.80   0.02   0.01   0.06 
  131072   7.9824e-03   4.9890e-04   525.44   0.01   0.01   0.03 
  262144   7.8160e-03   9.7700e-04   536.63   0.01   0.01   0.04 
  524288   7.6960e-03   1.9240e-03   545.00   0.02   0.01   0.05 
  1048576   7.6018e-03   3.8009e-03   551.75   0.03   0.02   0.08 
  2097152   7.5364e-03   7.5364e-03   556.54   0.03   0.02   0.12 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   7   9   8   1   3 
  4096   1   3   7   8   9 
  8192   6   2   3   1   7 
  16384   6   8   3   9   2 
  32768   9   3   8   2   6 
  65536   6   3   2   7   1 
  131072   3   9   7   6   8 
  262144   1   7   9   3   6 
  524288   1   9   3   7   6 
  1048576   7   9   6   1   3 
  2097152   6   4   7   3   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   4   7 
  4096    1   7   7 
  8192    2   3   7 
  16384    3   5   8 
  32768    2   5   9 
  65536    5   7   9 
  131072    6   9   9 
  262144    4   9   9 
  524288    5   9   9 
  1048576    3   6   9 
  2097152    2   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   6.4363e-02   6.2855e-05   65.17   0.14   0.13   0.40 
  4096   3.1570e-02   6.1660e-05   132.86   0.11   0.04   0.36 
  8192   1.4433e-02   5.6379e-05   290.61   0.16   0.14   0.46 
  16384   9.1787e-03   7.1709e-05   456.96   0.07   0.02   0.24 
  32768   8.2486e-03   1.2888e-04   508.49   0.04   0.03   0.10 
  65536   7.3894e-03   2.3092e-04   567.61   0.03   0.02   0.07 
  131072   7.2124e-03   4.5078e-04   581.54   0.01   0.01   0.03 
  262144   7.0495e-03   8.8119e-04   594.98   0.02   0.01   0.04 
  524288   7.0232e-03   1.7558e-03   597.21   0.01   0.02   0.03 
  1048576   7.0137e-03   3.5069e-03   598.02   0.01   0.01   0.04 
  2097152   7.2682e-03   7.2682e-03   577.08   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   7   8   9   1   3 
  4096   1   7   8   9   3 
  8192   2   6   3   1   7 
  16384   3   9   6   8   2 
  32768   7   9   3   1   8 
  65536   3   9   6   7   1 
  131072   8   7   2   1   3 
  262144   9   6   3   1   7 
  524288   2   8   3   7   1 
  1048576   1   7   9   6   3 
  2097152   3   6   8   5   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   4   7 
  4096    1   5   7 
  8192    2   3   7 
  16384    1   6   9 
  32768    3   7   9 
  65536    2   7   9 
  131072    5   9   9 
  262144    3   9   9 
  524288    2   9   9 
  1048576    4   9   9 
  2097152    2   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   4.5982e-02   4.4904e-05   91.22   0.29   0.19   0.94 
  4096   2.5683e-02   5.0162e-05   163.31   0.20   0.08   0.94 
  8192   1.4682e-02   5.7352e-05   285.68   0.07   0.02   0.29 
  16384   1.1631e-02   9.0869e-05   360.61   0.04   0.03   0.09 
  32768   1.0680e-02   1.6688e-04   392.72   0.02   0.02   0.05 
  65536   9.9762e-03   3.1176e-04   420.43   0.01   0.02   0.03 
  131072   9.9600e-03   6.2250e-04   421.11   0.01   0.01   0.02 
  262144   9.7040e-03   1.2130e-03   432.22   0.01   0.00   0.02 
  524288   9.6130e-03   2.4033e-03   436.32   0.03   0.01   0.08 
  1048576   9.4942e-03   4.7471e-03   441.78   0.03   0.01   0.07 
  2097152   9.5028e-03   9.5028e-03   441.38   0.02   0.01   0.09 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   4   2   3   5   9 
  4096   2   4   5   3   9 
  8192   4   2   5   1   6 
  16384   8   5   4   2   7 
  32768   3   5   4   9   8 
  65536   3   9   6   4   5 
  131072   3   5   8   6   7 
  262144   8   9   5   4   6 
  524288   2   8   3   6   9 
  1048576   9   8   2   3   5 
  2097152   5   9   6   7   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   4   5 
  4096    2   4   7 
  8192    3   6   8 
  16384    2   7   9 
  32768    3   9   9 
  65536    2   9   9 
  131072    5   9   9 
  262144    6   9   9 
  524288    5   6   9 
  1048576    5   6   9 
  2097152    5   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   4.4341e-02   4.3301e-05   94.59   0.31   0.21   0.89 
  4096   2.3486e-02   4.5872e-05   178.58   0.26   0.15   1.02 
  8192   1.4127e-02   5.5182e-05   296.91   0.12   0.01   0.69 
  16384   9.9526e-03   7.7755e-05   421.43   0.04   0.02   0.10 
  32768   8.9406e-03   1.3970e-04   469.13   0.04   0.02   0.12 
  65536   8.2396e-03   2.5749e-04   509.04   0.00   0.01   0.01 
  131072   7.9778e-03   4.9861e-04   525.75   0.01   0.01   0.02 
  262144   7.8278e-03   9.7847e-04   535.82   0.01   0.00   0.02 
  524288   7.6902e-03   1.9226e-03   545.41   0.03   0.01   0.10 
  1048576   7.6504e-03   3.8252e-03   548.25   0.01   0.00   0.03 
  2097152   7.5416e-03   7.5416e-03   556.16   0.04   0.03   0.12 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   4   3   5   9 
  4096   2   4   5   3   9 
  8192   6   2   4   5   3 
  16384   2   6   8   5   3 
  32768   2   5   9   3   8 
  65536   4   8   3   2   6 
  131072   9   7   8   2   3 
  262144   7   3   1   4   6 
  524288   4   1   7   9   3 
  1048576   4   9   3   1   6 
  2097152   2   3   4   6   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   4   5 
  4096    2   4   5 
  8192    4   5   8 
  16384    2   6   9 
  32768    4   6   9 
  65536    8   9   9 
  131072    7   9   9 
  262144    6   9   9 
  524288    5   6   9 
  1048576    6   9   9 
  2097152    1   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   4.9345e-02   4.8188e-05   85.00   0.24   0.16   0.66 
  4096   2.5381e-02   4.9573e-05   165.25   0.22   0.16   0.78 
  8192   1.4194e-02   5.5443e-05   295.51   0.14   0.06   0.80 
  16384   9.1087e-03   7.1162e-05   460.47   0.02   0.02   0.07 
  32768   8.2033e-03   1.2818e-04   511.30   0.01   0.01   0.05 
  65536   7.3480e-03   2.2963e-04   570.81   0.02   0.03   0.04 
  131072   7.1274e-03   4.4546e-04   588.48   0.01   0.02   0.03 
  262144   7.0612e-03   8.8265e-04   593.99   0.01   0.01   0.02 
  524288   6.9909e-03   1.7477e-03   599.96   0.01   0.02   0.03 
  1048576   7.0198e-03   3.5099e-03   597.50   0.01   0.01   0.02 
  2097152   7.2352e-03   7.2352e-03   579.71   0.01   0.01   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   4   2   3   5   9 
  4096   4   2   3   5   9 
  8192   4   3   2   5   6 
  16384   6   3   8   5   2 
  32768   4   2   5   7   8 
  65536   9   3   6   4   2 
  131072   8   4   5   2   7 
  262144   9   3   6   4   1 
  524288   2   8   5   4   9 
  1048576   4   7   1   9   6 
  2097152   5   3   4   6   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    2   4   5 
  4096    4   4   5 
  8192    4   4   8 
  16384    3   7   9 
  32768    3   9   9 
  65536    3   9   9 
  131072    4   9   9 
  262144    6   9   9 
  524288    3   9   9 
  1048576    3   9   9 
  2097152    2   9   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:01:13 EDT.
86876 accesses since 1/2/96.