PSTSWM AlphaSC-1000 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(unordered swap of 8KB message using MPI within a node)

(performance measured per processor when all processors in node communicating)

< td> Latency Definition:
Date/Person: January 3, 2002 / P. Worley
Platform: Compaq AlphaServer SC at Pittsburgh Supercomputer Center (lemieux.psc.edu):
     750 ES45 4-way SMP nodes (1.0 GHz Alpha 21264C with 8MB L2 cache)
Environment: SC System TS2.5; Digital UNIX V5.1;   RMS X.XX
Communication Library: MPI
SWAP size: 1024 REAL*8 floating point values each direction
Message size: Largest - 1024 REAL*8 floating point values
Smallest - 1 REAL*8 floating point values
Processors: 0 and 1
2 and 3
(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 156.93 37.36 35.8%
1 iter. 236.76 37.38 54.0%
10 iter. 269.83 38.67 63.7%
cache inv. w/overlap 147.07 37.49 33.7%
1 iter. w/overlap 236.76 37.69 54.5%
10 iter. w/overlap 260.97 37.93 60.4%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 161.90 25.69 53.7%
1 iter. 246.01 28.65 51.8%
10 iter. 291.53 27.83 53.5%
cache inv. w/overlap 179.65 18.48 49.6%
1 iter. w/overlap 245.27 18.27 49.5%
10 iter. w/overlap 296.70 20.18 50.1%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 149.22 34.72 41.2%
1 iter. 234.73 35.45 50.8%
10 iter. 286.63 29.66 51.9%
cache inv. w/overlap 197.40 18.18 50.6%
1 iter. w/overlap 240.23 18.12 49.7%
10 iter. w/overlap 317.52 20.85 50.0%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 121.18 51.23 37.9%
1 iter. 183.27 51.03 57.1%
10 iter. 200.05 51.15 62.4%
cache inv. w/overlap 192.30 18.43 49.4%
1 iter. w/overlap 244.54 18.87 48.6%
10 iter. w/overlap 303.97 20.21 50.2%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 118.55 51.83 37.5%
1 iter. 179.65 51.69 56.7%
10 iter. 210.37 51.53 66.2%
cache inv. w/overlap 185.76 18.83 48.0%
1 iter. w/overlap 265.11 18.07 50.8%
10 iter. w/overlap 313.87 20.12 51.9%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 171.74 27.00 51.9%
1 iter. 233.39 31.33 47.0%
10 iter. 289.16 28.26 52.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 150.04 34.07 36.4%
1 iter. 216.72 34.39 45.5%
10 iter. 252.22 34.15 52.6%
cache inv. w/overlap 143.22 33.06 50.5%
1 iter. w/overlap 212.78 33.12 50.3%
10 iter. w/overlap 165.73 32.22 50.4%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 162.54 34.48 37.1%
1 iter. 225.67 33.89 46.7%
10 iter. 248.92 34.20 52.0%
cache inv. w/overlap 188.76 35.04 40.4%
1 iter. w/overlap 226.93 34.71 48.1%
10 iter. w/overlap 247.19 37.51 56.6%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 160.31 33.82 37.6%
1 iter. 212.23 34.02 44.1%
10 iter. 249.91 34.00 51.9%
cache inv. w/overlap 179.65 28.41 37.9%
1 iter. w/overlap 236.76 27.95 40.4%
10 iter. w/overlap 277.13 33.22 56.2%


Protocol Sensitivity Summary for Bidirectional Swap of 8192 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.8496e-02   2.7828e-05   0.57   0.33   0.23   0.86 
  16   1.5342e-02   2.9965e-05   1.07   0.25   0.14   0.73 
  32   7.0790e-03   2.7652e-05   2.31   0.34   0.25   0.87 
  64   4.1054e-03   3.2073e-05   3.99   0.31   0.23   0.77 
  128   1.9788e-03   3.0919e-05   8.28   0.47   0.40   0.95 
  256   1.3422e-03   4.1944e-05   12.21   0.26   0.23   0.64 
  512   1.0284e-03   6.4275e-05   15.93   0.13   0.07   0.44 
  1024   5.3180e-04   6.6475e-05   30.81   0.10   0.05   0.36 
  2048   2.5040e-04   6.2600e-05   65.43   0.14   0.09   0.46 
  4096   1.5140e-04   7.5700e-05   108.22   0.12   0.06   0.38 
  8192   9.4400e-05   9.4400e-05   173.56   0.16   0.10   0.42 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   2   6   3   9   7 
  16   2   6   3   8   9 
  32   6   2   9   8   7 
  64   3   6   2   8   9 
  128   2   3   7   8   9 
  256   3   6   2   8   7 
  512   7   9   8   1   6 
  1024   9   8   1   7   3 
  2048   3   2   6   1   8 
  4096   1   6   2   3   8 
  8192   6   3   1   2   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    1   1   6 
  16    1   1   6 
  32    1   2   4 
  64    1   1   6 
  128    1   1   2 
  256    1   2   6 
  512    3   4   7 
  1024    2   4   7 
  2048    1   4   7 
  4096    2   4   7 
  8192    1   2   7 


Protocol Sensitivity Summary for Bidirectional Swap of 8192 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   3.0262e-02   2.9553e-05   0.54   0.27   0.16   0.75 
  16   1.5534e-02   3.0339e-05   1.05   0.24   0.13   0.70 
  32   7.5352e-03   2.9434e-05   2.17   0.26   0.16   0.77 
  64   4.9738e-03   3.8858e-05   3.29   0.13   0.03   0.44 
  128   2.1912e-03   3.4237e-05   7.48   0.30   0.25   0.74 
  256   1.2800e-03   4.0000e-05   12.80   0.34   0.27   0.71 
  512   1.0034e-03   6.2712e-05   16.33   0.14   0.09   0.44 
  1024   5.0240e-04   6.2800e-05   32.61   0.13   0.07   0.43 
  2048   2.4640e-04   6.1600e-05   66.49   0.13   0.05   0.46 
  4096   1.2180e-04   6.0900e-05   134.52   0.12   0.07   0.40 
  8192   7.0800e-05   7.0800e-05   231.41   0.10   0.06   0.30 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   2   6   9   8   7 
  16   6   2   9   7   8 
  32   2   3   6   7   9 
  64   3   9   8   7   2 
  128   6   3   2   9   8 
  256   3   2   8   9   7 
  512   7   9   8   6   2 
  1024   7   9   8   6   1 
  2048   3   1   9   7   8 
  4096   2   1   3   6   9 
  8192   2   6   1   3   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    1   2   6 
  16    2   2   7 
  32    2   3   6 
  64    2   5   7 
  128    2   3   3 
  256    1   2   2 
  512    3   3   7 
  1024    3   3   7 
  2048    2   5   7 
  4096    1   4   7 
  8192    2   4   7 


Protocol Sensitivity Summary for Bidirectional Swap of 8192 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   3.0113e-02   2.9407e-05   0.54   0.26   0.16   0.75 
  16   1.5864e-02   3.0984e-05   1.03   0.22   0.10   0.67 
  32   7.7178e-03   3.0148e-05   2.12   0.25   0.14   0.72 
  64   5.0381e-03   3.9360e-05   3.25   0.13   0.07   0.43 
  128   2.7445e-03   4.2883e-05   5.97   0.11   0.04   0.40 
  256   1.4282e-03   4.4632e-05   11.47   0.23   0.15   0.54 
  512   9.9850e-04   6.2406e-05   16.41   0.14   0.08   0.47 
  1024   4.9876e-04   6.2345e-05   32.85   0.15   0.10   0.47 
  2048   2.5154e-04   6.2885e-05   65.13   0.13   0.11   0.39 
  4096   1.2218e-04   6.1090e-05   134.10   0.11   0.04   0.38 
  8192   5.6520e-05   5.6520e-05   289.88   0.15   0.14   0.44 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   2   6   3   9   7 
  16   2   6   9   7   8 
  32   2   6   9   7   8 
  64   9   8   7   2   3 
  128   9   8   7   2   3 
  256   3   8   9   7   2 
  512   7   9   8   2   6 
  1024   7   9   8   1   2 
  2048   9   7   8   1   3 
  4096   1   3   7   8   9 
  8192   6   2   3   1   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    1   2   6 
  16    1   2   7 
  32    1   2   6 
  64    2   3   7 
  128    3   6   7 
  256    1   1   7 
  512    3   3   7 
  1024    3   3   7 
  2048    3   4   7 
  4096    1   5   7 
  8192    3   4   7 


Protocol Sensitivity Summary for Bidirectional Swap of 8192 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.8342e-02   1.7912e-05   0.89   0.47   0.58   1.09 
  16   9.0322e-03   1.7641e-05   1.81   0.49   0.59   1.12 
  32   4.6832e-03   1.8294e-05   3.50   0.46   0.54   1.05 
  64   2.7290e-03   2.1320e-05   6.00   0.49   0.56   1.06 
  128   1.5550e-03   2.4297e-05   10.54   0.42   0.51   0.98 
  256   1.0316e-03   3.2237e-05   15.88   0.32   0.30   0.92 
  512   7.4940e-04   4.6838e-05   21.86   0.25   0.17   0.73 
  1024   3.8000e-04   4.7500e-05   43.12   0.27   0.20   0.89 
  2048   2.0880e-04   5.2200e-05   78.47   0.22   0.12   0.81 
  4096   1.2780e-04   6.3900e-05   128.20   0.14   0.11   0.54 
  8192   8.6000e-05   8.6000e-05   190.51   0.10   0.06   0.32 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   3   5   2   4   9 
  16   3   5   2   4   9 
  32   3   5   2   4   9 
  64   3   4   5   2   9 
  128   5   4   2   3   9 
  256   4   5   3   2   6 
  512   5   4   3   2   9 
  1024   4   5   2   3   9 
  2048   4   2   3   5   9 
  4096   4   3   2   5   9 
  8192   5   4   2   3   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    1   4   4 
  16    1   3   4 
  32    2   4   4 
  64    2   4   4 
  128    1   4   4 
  256    3   4   4 
  512    3   4   5 
  1024    1   4   5 
  2048    2   3   5 
  4096    2   3   8 
  8192    2   4   8 


Protocol Sensitivity Summary for Bidirectional Swap of 8192 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.8409e-02   1.7977e-05   0.89   0.46   0.55   1.09 
  16   9.1322e-03   1.7836e-05   1.79   0.46   0.56   1.11 
  32   4.6026e-03   1.7979e-05   3.56   0.45   0.55   1.10 
  64   2.7140e-03   2.1203e-05   6.04   0.46   0.54   1.08 
  128   1.5354e-03   2.3991e-05   10.67   0.45   0.50   1.01 
  256   1.0164e-03   3.1762e-05   16.12   0.33   0.36   0.80 
  512   7.1080e-04   4.4425e-05   23.05   0.26   0.20   0.72 
  1024   3.5800e-04   4.4750e-05   45.77   0.26   0.20   0.69 
  2048   1.8700e-04   4.6750e-05   87.61   0.22   0.17   0.64 
  4096   1.0500e-04   5.2500e-05   156.04   0.16   0.12   0.70 
  8192   6.5400e-05   6.5400e-05   250.52   0.07   0.06   0.22 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   3   5   2   4   9 
  16   3   5   2   4   9 
  32   3   5   2   4   9 
  64   5   3   2   4   9 
  128   3   5   2   4   9 
  256   4   2   3   5   9 
  512   2   3   5   4   9 
  1024   5   4   2   3   9 
  2048   4   5   2   3   9 
  4096   5   4   3   2   9 
  8192   2   4   5   3   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   4   4 
  16    1   4   4 
  32    2   4   4 
  64    1   4   4 
  128    1   2   4 
  256    1   4   4 
  512    3   4   5 
  1024    3   4   5 
  2048    2   4   5 
  4096    1   4   8 
  8192    1   4   9 


Protocol Sensitivity Summary for Bidirectional Swap of 8192 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.0732e-02   2.0246e-05   0.79   0.39   0.54   0.88 
  16   1.0216e-02   1.9953e-05   1.60   0.41   0.61   0.91 
  32   5.0742e-03   1.9821e-05   3.23   0.42   0.61   0.93 
  64   3.0257e-03   2.3638e-05   5.41   0.41   0.56   0.85 
  128   1.7129e-03   2.6764e-05   9.57   0.36   0.50   0.80 
  256   1.0629e-03   3.3217e-05   15.41   0.30   0.40   0.71 
  512   7.5764e-04   4.7352e-05   21.63   0.24   0.18   0.64 
  1024   3.8318e-04   4.7898e-05   42.76   0.23   0.17   0.62 
  2048   1.9240e-04   4.8100e-05   85.16   0.23   0.16   0.62 
  4096   9.8180e-05   4.9090e-05   166.88   0.22   0.18   0.79 
  8192   4.9660e-05   4.9660e-05   329.92   0.21   0.14   0.95 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   4   2   5   3   6 
  16   3   4   2   5   7 
  32   3   5   4   2   6 
  64   4   3   2   5   7 
  128   2   4   3   5   7 
  256   2   4   5   3   9 
  512   2   4   3   5   9 
  1024   2   4   5   3   9 
  2048   2   4   3   5   9 
  4096   4   2   5   3   9 
  8192   4   3   2   5   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    4   4   4 
  16    1   4   4 
  32    1   4   4 
  64    2   4   4 
  128    1   4   4 
  256    2   4   4 
  512    2   4   5 
  1024    2   4   5 
  2048    2   4   5 
  4096    3   4   5 
  8192    1   4   7 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:01:19 EDT.
86294 accesses since 1/2/96.