PSTSWM AlphaSC-1000 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(ordered swap of 8KB message using MPI within a node)

(performance measured per processor when all processors in node communicating)

> Latency Definition:
Date/Person: January 3, 2002 / P. Worley
Platform: Compaq AlphaServer SC at Pittsburgh Supercomputer Center (lemieux.psc.edu):
     750 ES45 4-way SMP nodes (1.0 GHz Alpha 21264C with 8MB L2 cache)
Environment: SC System TS2.5; Digital UNIX V5.1;   RMS X.XX
Communication Library: MPI
SWAP size: 1024 REAL*8 floating point values each direction
Message size: Largest - 1024 REAL*8 floating point values
Smallest - 1 REAL*8 floating point values
Processors: 0 and 1
2 and 3
(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 149.49 9.50 53.4%
1 iter. 232.07 9.54 57.3%
10 iter. 277.69 9.48 58.4%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 142.47 9.65 52.7%
1 iter. 226.93 9.36 58.0%
10 iter. 273.25 9.55 58.2%
cache inv. w/overlap 135.40 9.69 53.0%
1 iter. w/overlap 228.83 9.61 57.3%
10 iter. w/overlap 265.54 11.14 55.1%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 140.51 10.23 50.5%
1 iter. 228.19 10.23 54.8%
10 iter. 272.16 9.99 56.1%
cache inv. w/overlap 151.14 10.29 52.4%
1 iter. w/overlap 240.94 10.24 55.2%
10 iter. w/overlap 273.52 12.00 53.4%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 139.56 10.49 50.1%
1 iter. 229.47 10.01 55.5%
10 iter. 265.28 10.13 55.6%
cache inv. w/overlap 150.59 10.57 52.0%
1 iter. w/overlap 244.54 10.29 55.1%
10 iter. w/overlap 265.46 11.95 54.1%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 120.65 23.65 34.8%
1 iter. 193.21 23.42 55.2%
10 iter. 212.61 23.15 60.1%
cache inv. w/overlap 150.87 10.46 51.8%
1 iter. w/overlap 243.09 10.23 55.1%
10 iter. w/overlap 267.28 12.07 52.9%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 121.00 23.32 34.4%
1 iter. 197.87 22.87 55.2%
10 iter. 201.57 22.95 56.5%
cache inv. w/overlap 149.22 10.56 51.8%
1 iter. w/overlap 234.06 10.32 55.2%
10 iter. w/overlap 262.73 12.08 54.1%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 141.49 20.12 43.3%
1 iter. 206.87 20.53 51.8%
10 iter. 211.90 20.49 53.0%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 134.30 17.82 33.1%
1 iter. 219.62 17.81 47.7%
10 iter. 250.75 17.78 54.4%
cache inv. w/overlap 130.86 18.09 33.7%
1 iter. w/overlap 213.89 17.91 46.8%
10 iter. w/overlap 237.86 19.80 57.5%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 133.42 17.42 35.0%
1 iter. 205.83 17.32 43.5%
10 iter. 245.93 17.37 52.1%
cache inv. w/overlap 149.49 18.18 34.6%
1 iter. w/overlap 228.19 17.38 48.4%
10 iter. w/overlap 242.80 19.64 58.2%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 134.52 17.69 34.0%
1 iter. 212.23 17.43 45.2%
10 iter. 243.37 17.50 52.0%
cache inv. w/overlap 142.47 17.92 34.0%
1 iter. w/overlap 220.22 17.46 46.9%
10 iter. w/overlap 240.45 19.66 57.7%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 140.27 17.65 34.2%
1 iter. 228.19 17.72 49.4%
10 iter. 253.31 17.70 54.7%


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.9574e-02   1.9116e-05   0.84   0.68   0.83   1.43 
  16   9.8340e-03   1.9207e-05   1.67   0.66   0.82   1.37 
  32   4.9124e-03   1.9189e-05   3.34   0.67   0.84   1.39 
  64   3.0028e-03   2.3459e-05   5.46   0.60   0.71   1.31 
  128   1.7136e-03   2.6775e-05   9.56   0.53   0.62   1.18 
  256   1.0950e-03   3.4219e-05   14.96   0.41   0.48   0.93 
  512   8.8760e-04   5.5475e-05   18.46   0.20   0.17   0.51 
  1024   4.5340e-04   5.6675e-05   36.14   0.20   0.19   0.48 
  2048   2.3500e-04   5.8750e-05   69.72   0.18   0.16   0.38 
  4096   1.6100e-04   8.0500e-05   101.76   0.10   0.07   0.27 
  8192   1.0860e-04   1.0860e-04   150.87   0.10   0.09   0.20 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   2   3   8 
  16   1   0   2   3   9 
  32   0   1   2   3   8 
  64   1   0   2   3   10 
  128   0   1   3   2   10 
  256   0   1   2   3   7 
  512   0   1   2   3   7 
  1024   0   2   1   3   7 
  2048   0   1   2   3   7 
  4096   0   1   10   3   2 
  8192   0   6   10   1   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   4 
  16    2   3   4 
  32    2   2   4 
  64    2   4   4 
  128    2   4   4 
  256    2   4   4 
  512    2   4   8 
  1024    1   4   8 
  2048    1   2   8 
  4096    2   3   10 
  8192    1   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.9446e-02   1.8990e-05   0.84   0.69   0.84   1.45 
  16   9.6892e-03   1.8924e-05   1.69   0.69   0.85   1.44 
  32   4.8942e-03   1.9118e-05   3.35   0.68   0.84   1.47 
  64   2.9336e-03   2.2919e-05   5.58   0.64   0.76   1.37 
  128   1.6882e-03   2.6378e-05   9.71   0.53   0.64   1.17 
  256   1.0774e-03   3.3669e-05   15.21   0.40   0.49   0.94 
  512   8.8020e-04   5.5013e-05   18.61   0.20   0.16   0.55 
  1024   4.3760e-04   5.4700e-05   37.44   0.20   0.16   0.51 
  2048   2.1720e-04   5.4300e-05   75.43   0.19   0.19   0.44 
  4096   1.1680e-04   5.8400e-05   140.27   0.14   0.14   0.32 
  8192   6.9400e-05   6.9400e-05   236.08   0.09   0.08   0.22 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   1   0   2   3   8 
  16   0   1   2   3   9 
  32   1   0   2   3   8 
  64   0   1   2   3   8 
  128   1   0   2   3   8 
  256   0   2   1   3   8 
  512   0   3   2   1   10 
  1024   3   2   1   0   10 
  2048   0   2   3   1   7 
  4096   1   0   2   3   7 
  8192   0   1   10   3   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   4 
  16    1   3   4 
  32    2   3   4 
  64    2   3   4 
  128    2   4   4 
  256    3   4   4 
  512    4   4   8 
  1024    3   4   8 
  2048    1   4   8 
  4096    2   4   8 
  8192    1   5   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.9449e-02   1.8993e-05   0.84   0.68   0.84   1.43 
  16   9.7451e-03   1.9033e-05   1.68   0.68   0.84   1.41 
  32   4.8944e-03   1.9119e-05   3.35   0.68   0.84   1.42 
  64   2.9673e-03   2.3182e-05   5.52   0.62   0.74   1.33 
  128   1.6904e-03   2.6413e-05   9.69   0.52   0.63   1.19 
  256   1.0696e-03   3.3425e-05   15.32   0.42   0.49   0.96 
  512   8.6412e-04   5.4008e-05   18.96   0.22   0.17   0.58 
  1024   4.3310e-04   5.4138e-05   37.83   0.21   0.17   0.54 
  2048   2.1662e-04   5.4155e-05   75.63   0.19   0.18   0.51 
  4096   1.0886e-04   5.4430e-05   150.51   0.18   0.17   0.41 
  8192   5.8880e-05   5.8880e-05   278.26   0.14   0.11   0.36 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   2   3   8 
  16   0   1   2   3   8 
  32   0   1   2   3   8 
  64   0   1   2   3   8 
  128   0   1   2   3   10 
  256   0   1   2   3   10 
  512   2   3   0   1   10 
  1024   2   3   0   1   10 
  2048   0   3   1   2   8 
  4096   0   2   1   3   7 
  8192   0   1   2   3   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   4 
  16    2   3   4 
  32    2   3   4 
  64    2   3   4 
  128    2   4   4 
  256    2   4   4 
  512    3   4   8 
  1024    4   4   8 
  2048    4   4   8 
  4096    1   4   8 
  8192    1   4   8 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.9520e-02   1.9062e-05   0.84   0.48   0.10   1.28 
  16   9.7850e-03   1.9111e-05   1.67   0.47   0.08   1.25 
  32   4.9554e-03   1.9357e-05   3.31   0.45   0.08   1.23 
  64   3.0018e-03   2.3452e-05   5.46   0.41   0.07   1.13 
  128   1.7142e-03   2.6784e-05   9.56   0.35   0.05   0.97 
  256   1.0972e-03   3.4287e-05   14.93   0.26   0.05   0.71 
  512   9.1240e-04   5.7025e-05   17.96   0.11   0.02   0.49 
  1024   4.6360e-04   5.7950e-05   35.34   0.11   0.04   0.45 
  2048   2.4280e-04   6.0700e-05   67.48   0.10   0.05   0.34 
  4096   1.5360e-04   7.6800e-05   106.67   0.08   0.06   0.21 
  8192   9.9800e-05   9.9800e-05   164.17   0.12   0.11   0.24 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   2   4   3 
  16   0   1   4   2   3 
  32   0   1   2   4   3 
  64   0   1   2   4   3 
  128   0   1   2   4   5 
  256   0   1   4   2   3 
  512   0   1   2   4   5 
  1024   2   4   0   3   5 
  2048   0   4   2   5   1 
  4096   3   2   0   5   4 
  8192   4   0   2   5   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    1   2   6 
  16    2   2   6 
  32    2   2   6 
  64    2   3   6 
  128    2   4   6 
  256    1   5   6 
  512    4   6   10 
  1024    2   6   10 
  2048    1   6   10 
  4096    1   5   11 
  8192    1   1   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   1.9505e-02   1.9048e-05   0.84   0.45   0.09   1.28 
  16   9.7406e-03   1.9025e-05   1.68   0.45   0.09   1.28 
  32   4.8816e-03   1.9069e-05   3.36   0.46   0.09   1.30 
  64   2.9284e-03   2.2878e-05   5.59   0.41   0.07   1.18 
  128   1.6854e-03   2.6334e-05   9.72   0.35   0.05   1.00 
  256   1.0640e-03   3.3250e-05   15.40   0.26   0.04   0.69 
  512   8.7240e-04   5.4525e-05   18.78   0.11   0.02   0.51 
  1024   4.3020e-04   5.3775e-05   38.08   0.12   0.03   0.51 
  2048   2.2060e-04   5.5150e-05   74.27   0.10   0.03   0.38 
  4096   1.1500e-04   5.7500e-05   142.47   0.09   0.05   0.29 
  8192   6.5200e-05   6.5200e-05   251.29   0.09   0.08   0.17 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   2   4   5 
  16   0   1   2   4   5 
  32   0   1   2   4   3 
  64   0   1   2   4   3 
  128   0   1   2   4   3 
  256   0   1   2   4   3 
  512   0   4   2   3   1 
  1024   0   4   5   2   3 
  2048   4   0   5   3   1 
  4096   0   4   2   5   1 
  8192   4   3   2   0   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   6 
  16    2   2   6 
  32    2   2   6 
  64    1   2   6 
  128    1   5   6 
  256    1   6   6 
  512    2   6   10 
  1024    1   6   10 
  2048    3   6   10 
  4096    2   6   10 
  8192    1   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 8192 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  8   2.2676e-02   2.2145e-05   0.72   0.39   0.09   0.97 
  16   1.1340e-02   2.2149e-05   1.44   0.38   0.09   0.99 
  32   5.6931e-03   2.2239e-05   2.88   0.38   0.08   0.98 
  64   3.3752e-03   2.6369e-05   4.85   0.34   0.09   0.89 
  128   1.8948e-03   2.9606e-05   8.65   0.31   0.08   0.82 
  256   1.1580e-03   3.6187e-05   14.15   0.25   0.06   0.66 
  512   9.2360e-04   5.7725e-05   17.74   0.11   0.06   0.49 
  1024   4.6196e-04   5.7745e-05   35.47   0.11   0.06   0.48 
  2048   2.2880e-04   5.7200e-05   71.61   0.12   0.06   0.47 
  4096   1.1510e-04   5.7550e-05   142.35   0.11   0.04   0.36 
  8192   5.7680e-05   5.7680e-05   284.05   0.11   0.07   0.32 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  8   0   1   3   4   2 
  16   0   1   3   4   2 
  32   0   1   5   3   4 
  64   0   1   4   3   2 
  128   0   1   4   2   3 
  256   1   0   4   2   3 
  512   0   1   4   2   3 
  1024   0   1   2   4   5 
  2048   0   1   2   4   3 
  4096   0   4   1   2   5 
  8192   0   2   4   1   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  8    2   2   6 
  16    2   2   6 
  32    2   2   6 
  64    2   2   6 
  128    2   2   6 
  256    2   2   6 
  512    2   5   10 
  1024    2   4   10 
  2048    1   4   10 
  4096    1   6   10 
  8192    1   4   10 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:01:31 EDT.
86231 accesses since 1/2/96.