PSTSWM AlphaSC-1000 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(unordered swap of 128KB message using MPI within a node)

(performance measured per processor when all processors in node communicating)

< tr>
Date/Person: January 3, 2002 / P. Worley
Platform: Compaq AlphaServer SC at Pittsburgh Supercomputer Center (lemieux.psc.edu):
     750 ES45 4-way SMP nodes (1.0 GHz Alpha 21264C with 8MB L2 cache)
Environment: SC System TS2.5; Digital UNIX V5.1;   RMS X.XX
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 1
2 and 3
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 384.26 39.96 36.3%
1 iter. 588.56 40.14 38.4%
10 iter. 592.36 40.52 37.9%
cache inv. w/overlap 377.40 40.73 36.0%
1 iter. w/overlap 585.14 41.14 37.2%
10 iter. w/overlap 591.85 37.12 42.9%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 383.03 37.12 41.8%
1 iter. 582.54 40.76 37.0%
10 iter. 593.19 34.83 45.7%
cache inv. w/overlap 386.87 19.11 51.7%
1 iter. w/overlap 589.09 19.22 51.7%
10 iter. w/overlap 595.16 21.10 51.3%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 382.13 33.95 47.5%
1 iter. 584.36 38.13 41.8%
10 iter. 600.01 40.85 37.6%
cache inv. w/overlap 390.79 17.59 55.0%
1 iter. w/overlap 589.88 17.98 54.8%
10 iter. w/overlap 598.99 21.18 52.5%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 358.02 51.19 39.7%
1 iter. 555.86 51.09 40.3%
10 iter. 575.76 51.53 39.8%
cache inv. w/overlap 385.73 18.77 52.6%
1 iter. w/overlap 593.62 19.41 51.8%
10 iter. w/overlap 598.99 20.39 52.3%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 363.38 50.97 41.3%
1 iter. 563.99 52.00 41.5%
10 iter. 575.38 51.62 40.7%
cache inv. w/overlap 391.26 18.32 53.5%
1 iter. w/overlap 592.01 17.68 55.3%
10 iter. w/overlap 601.05 20.79 53.5%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 390.21 39.25 38.4%
1 iter. 579.20 35.90 44.1%
10 iter. 592.12 37.44 41.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 350.84 36.25 37.4%
1 iter. 584.88 35.87 39.8%
10 iter. 596.22 35.99 39.5%
cache inv. w/overlap 384.83 24.75 64.7%
1 iter. w/overlap 584.88 23.88 66.4%
10 iter. w/overlap 590.31 32.39 56.1%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 382.47 35.78 38.8%
1 iter. 577.66 35.27 40.9%
10 iter. 593.14 35.45 40.7%
cache inv. w/overlap 382.92 36.91 38.4%
1 iter. w/overlap 584.10 35.68 40.6%
10 iter. w/overlap 600.48 40.06 36.9%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 386.76 34.37 40.7%
1 iter. 581.51 35.29 40.7%
10 iter. 536.15 35.44 40.2%
cache inv. w/overlap 384.04 28.91 40.1%
1 iter. w/overlap 591.48 28.71 41.6%
10 iter. w/overlap 583.37 34.35 35.1%


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   4.0380e-02   3.9434e-05   6.49   0.20   0.12   0.52 
  256   2.3000e-02   4.4922e-05   11.40   0.22   0.14   0.54 
  512   1.5976e-02   6.2407e-05   16.41   0.14   0.09   0.47 
  1024   8.0470e-03   6.2867e-05   32.58   0.14   0.12   0.41 
  2048   3.9814e-03   6.2209e-05   65.84   0.10   0.04   0.35 
  4096   1.8072e-03   5.6475e-05   145.06   0.19   0.15   0.53 
  8192   9.6220e-04   6.0137e-05   272.44   0.14   0.12   0.38 
  16384   8.1680e-04   1.0210e-04   320.94   0.07   0.03   0.21 
  32768   7.3880e-04   1.8470e-04   354.82   0.04   0.01   0.13 
  65536   7.1720e-04   3.5860e-04   365.51   0.06   0.02   0.23 
  131072   6.6980e-04   6.6980e-04   391.38   0.03   0.03   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   3   9   8   7   2 
  256   3   8   7   9   2 
  512   9   7   8   1   6 
  1024   9   7   8   1   3 
  2048   1   9   7   8   3 
  4096   3   6   2   1   7 
  8192   6   3   2   1   8 
  16384   6   2   3   9   8 
  32768   1   2   3   6   7 
  65536   2   9   1   6   3 
  131072   7   3   9   6   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   7 
  256    1   1   7 
  512    3   3   7 
  1024    3   3   7 
  2048    1   5   7 
  4096    1   3   7 
  8192    1   2   7 
  16384    1   5   9 
  32768    3   6   9 
  65536    2   6   9 
  131072    1   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   4.3956e-02   4.2926e-05   5.96   0.11   0.03   0.41 
  256   2.4196e-02   4.7257e-05   10.83   0.17   0.08   0.45 
  512   1.6000e-02   6.2499e-05   16.38   0.14   0.08   0.47 
  1024   7.9568e-03   6.2162e-05   32.95   0.15   0.10   0.47 
  2048   4.0210e-03   6.2828e-05   65.19   0.13   0.12   0.39 
  4096   1.9706e-03   6.1581e-05   133.03   0.11   0.03   0.36 
  8192   8.9940e-04   5.6212e-05   291.47   0.16   0.15   0.47 
  16384   5.9140e-04   7.3925e-05   443.26   0.07   0.01   0.25 
  32768   5.0960e-04   1.2740e-04   514.41   0.06   0.02   0.18 
  65536   4.6760e-04   2.3380e-04   560.62   0.03   0.01   0.11 
  131072   4.4460e-04   4.4460e-04   589.62   0.03   0.01   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   8   9   3   7   2 
  256   2   3   8   7   9 
  512   7   9   8   6   2 
  1024   7   9   8   1   6 
  2048   7   8   9   1   3 
  4096   1   7   3   9   8 
  8192   6   2   3   1   7 
  16384   1   2   6   8   3 
  32768   6   1   9   3   8 
  65536   7   9   3   1   6 
  131072   9   2   8   7   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    4   5   7 
  256    1   2   7 
  512    3   3   7 
  1024    3   3   7 
  2048    3   4   7 
  4096    1   5   7 
  8192    3   4   7 
  16384    4   6   8 
  32768    1   6   9 
  65536    3   7   9 
  131072    5   6   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   4.4008e-02   4.2976e-05   5.96   0.12   0.06   0.40 
  256   2.5856e-02   5.0500e-05   10.14   0.11   0.05   0.36 
  512   1.5954e-02   6.2319e-05   16.43   0.14   0.08   0.44 
  1024   7.9890e-03   6.2414e-05   32.81   0.15   0.10   0.46 
  2048   4.0212e-03   6.2831e-05   65.19   0.14   0.13   0.39 
  4096   1.9726e-03   6.1643e-05   132.89   0.11   0.04   0.37 
  8192   8.8566e-04   5.5354e-05   295.99   0.17   0.16   0.47 
  16384   5.6128e-04   7.0160e-05   467.05   0.11   0.06   0.24 
  32768   4.9816e-04   1.2454e-04   526.22   0.05   0.04   0.13 
  65536   4.5328e-04   2.2664e-04   578.33   0.06   0.06   0.13 
  131072   4.3770e-04   4.3770e-04   598.91   0.02   0.03   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   8   9   7   2   6 
  256   8   7   9   3   2 
  512   7   9   8   2   6 
  1024   7   9   8   2   1 
  2048   7   9   8   1   3 
  4096   1   7   8   9   3 
  8192   2   6   3   1   7 
  16384   8   2   3   1   7 
  32768   7   9   8   3   1 
  65536   1   3   8   7   5 
  131072   2   7   3   8   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    3   4   7 
  256    3   4   7 
  512    3   3   7 
  1024    3   3   7 
  2048    3   3   7 
  4096    1   5   7 
  8192    1   3   7 
  16384    2   3   9 
  32768    1   6   9 
  65536    2   4   9 
  131072    3   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.5357e-02   2.4763e-05   10.34   0.42   0.46   0.95 
  256   1.6205e-02   3.1650e-05   16.18   0.37   0.37   0.84 
  512   1.1486e-02   4.4868e-05   22.82   0.27   0.18   0.73 
  1024   5.7462e-03   4.4892e-05   45.62   0.28   0.19   0.82 
  2048   2.9126e-03   4.5509e-05   90.00   0.28   0.19   1.01 
  4096   1.6588e-03   5.1837e-05   158.03   0.21   0.07   0.99 
  8192   9.6520e-04   6.0325e-05   271.60   0.07   0.07   0.14 
  16384   8.2040e-04   1.0255e-04   319.53   0.06   0.02   0.25 
  32768   7.3960e-04   1.8490e-04   354.44   0.03   0.02   0.16 
  65536   7.0440e-04   3.5220e-04   372.15   0.03   0.02   0.05 
  131072   6.5040e-04   6.5040e-04   403.05   0.04   0.04   0.07 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   3   5   4   2   9 
  256   5   3   4   2   9 
  512   3   2   5   4   9 
  1024   4   5   3   2   9 
  2048   4   2   3   5   9 
  4096   3   4   5   2   9 
  8192   4   2   6   3   5 
  16384   5   2   8   9   6 
  32768   3   9   2   5   8 
  65536   2   5   3   8   9 
  131072   4   2   8   3   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    2   4   4 
  256    2   4   4 
  512    4   4   5 
  1024    4   4   5 
  2048    3   4   5 
  4096    1   3   7 
  8192    1   4   9 
  16384    2   7   8 
  32768    2   7   9 
  65536    1   9   9 
  131072    1   6   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.5434e-02   2.4838e-05   10.31   0.40   0.44   0.95 
  256   1.6302e-02   3.1839e-05   16.08   0.34   0.34   0.84 
  512   1.1105e-02   4.3378e-05   23.61   0.28   0.20   0.76 
  1024   5.5612e-03   4.3447e-05   47.14   0.29   0.20   0.77 
  2048   2.7768e-03   4.3387e-05   94.41   0.30   0.21   0.85 
  4096   1.4492e-03   4.5288e-05   180.89   0.27   0.17   1.03 
  8192   8.8220e-04   5.5137e-05   297.15   0.14   0.01   0.84 
  16384   5.8360e-04   7.2950e-05   449.18   0.02   0.01   0.05 
  32768   5.0740e-04   1.2685e-04   516.64   0.01   0.01   0.03 
  65536   4.6260e-04   2.3130e-04   566.68   0.01   0.01   0.02 
  131072   4.4080e-04   4.4080e-04   594.70   0.03   0.01   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   5   3   4   2   9 
  256   3   5   4   2   9 
  512   2   5   3   4   9 
  1024   3   2   5   4   9 
  2048   2   3   4   5   9 
  4096   2   4   5   3   9 
  8192   2   3   4   5   6 
  16384   3   8   5   2   4 
  32768   5   4   3   2   9 
  65536   2   3   4   8   9 
  131072   4   5   2   3   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    2   4   4 
  256    3   4   4 
  512    3   4   5 
  1024    4   4   5 
  2048    4   4   5 
  4096    1   4   5 
  8192    5   5   8 
  16384    4   9   9 
  32768    6   9   9 
  65536    5   9   9 
  131072    6   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.7548e-02   2.6903e-05   9.52   0.36   0.50   0.74 
  256   1.6956e-02   3.3118e-05   15.46   0.32   0.41   0.71 
  512   1.1854e-02   4.6304e-05   22.11   0.26   0.20   0.68 
  1024   5.9650e-03   4.6602e-05   43.95   0.26   0.19   0.68 
  2048   3.0513e-03   4.7676e-05   85.91   0.25   0.17   0.67 
  4096   1.5566e-03   4.8644e-05   168.41   0.24   0.18   0.82 
  8192   8.7054e-04   5.4409e-05   301.13   0.16   0.07   0.85 
  16384   5.5368e-04   6.9210e-05   473.46   0.05   0.03   0.17 
  32768   4.9578e-04   1.2395e-04   528.75   0.03   0.02   0.06 
  65536   4.5398e-04   2.2699e-04   577.44   0.03   0.01   0.19 
  131072   4.3346e-04   4.3346e-04   604.77   0.02   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   4   2   5   3   7 
  256   2   4   5   3   9 
  512   4   2   3   5   9 
  1024   4   2   3   5   9 
  2048   4   2   3   5   9 
  4096   4   2   5   3   9 
  8192   2   3   4   5   6 
  16384   2   8   3   4   5 
  32768   5   4   8   3   7 
  65536   5   3   8   1   4 
  131072   2   8   4   3   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    2   4   4 
  256    2   4   4 
  512    1   4   5 
  1024    1   4   5 
  2048    2   4   5 
  4096    1   4   5 
  8192    1   4   8 
  16384    1   7   9 
  32768    2   8   9 
  65536    5   8   9 
  131072    3   9   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:01:16 EDT.
86205 accesses since 1/2/96.