PSTSWM AlphaSC-1000 Point-to-Point Communication Performance

Performance Studies using

PSTSWM


Compaq AlphaServer SC SWAP Performance

(unordered swap of 128KB message using MPI between two nodes)

(performance measured per processor when all processors in node communicating)

< tr>
Date/Person: January 3, 2002 / P. Worley
Platform: Compaq AlphaServer SC at Pittsburgh Supercomputer Center (lemieux.psc.edu):
     750 ES45 4-way SMP nodes (1.0 GHz Alpha 21264C with 8MB L2 cache)
Environment: SC System TS2.5; Digital UNIX V5.1;   RMS X.XX
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 4 nodes
1 and 5
2 and 6
3 and 7
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.33 29.63 27.6%
1 iter. 62.55 29.79 27.0%
10 iter. 63.35 31.41 21.6%
cache inv. w/overlap 62.81 30.13 29.8%
1 iter. w/overlap 63.18 29.88 29.1%
10 iter. w/overlap 63.78 32.23 30.4%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.82 41.99 22.1%
1 iter. 63.16 40.84 20.9%
10 iter. 63.39 42.45 22.2%
cache inv. w/overlap 63.09 18.91 38.7%
1 iter. w/overlap 63.37 18.97 40.6%
10 iter. w/overlap 63.48 19.96 40.4%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.93 42.43 22.6%
1 iter. 62.94 41.69 22.6%
10 iter. 63.49 42.32 22.4%
cache inv. w/overlap 63.10 18.84 28.5%
1 iter. w/overlap 62.96 18.81 29.6%
10 iter. w/overlap 63.40 20.11 32.4%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.59 57.84 10.2%
1 iter. 62.84 57.44 10.8%
10 iter. 63.25 57.35 11.2%
cache inv. w/overlap 63.06 19.26 37.8%
1 iter. w/overlap 62.77 18.96 39.6%
10 iter. w/overlap 63.39 20.09 39.9%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.53 57.30 10.6%
1 iter. 63.09 55.11 14.8%
10 iter. 63.22 56.52 12.8%
cache inv. w/overlap 63.11 18.51 29.3%
1 iter. w/overlap 63.09 18.86 29.5%
10 iter. w/overlap 63.40 20.39 31.9%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.73 42.96 23.0%
1 iter. 63.01 41.94 22.5%
10 iter. 63.40 42.47 22.3%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.35 35.25 15.2%
1 iter. 62.90 35.41 15.2%
10 iter. 63.41 35.53 14.7%
cache inv. w/overlap 62.64 30.88 30.6%
1 iter. w/overlap 62.69 29.89 29.3%
10 iter. w/overlap 63.28 33.78 16.0%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.86 36.94 16.0%
1 iter. 63.05 36.51 15.6%
10 iter. 63.29 36.42 15.4%
cache inv. w/overlap 62.75 36.11 16.5%
1 iter. w/overlap 62.80 38.67 18.2%
10 iter. w/overlap 63.48 38.22 17.6%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 62.70 35.74 15.4%
1 iter. 63.51 35.70 15.0%
10 iter. 63.58 36.10 15.1%
cache inv. w/overlap 62.96 30.18 14.4%
1 iter. w/overlap 62.80 30.64 14.1%
10 iter. w/overlap 63.44 34.09 11.2%


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   4.1933e-02   4.0950e-05   6.25   0.20   0.16   0.60 
  256   2.5430e-02   4.9669e-05   10.31   0.14   0.05   0.48 
  512   1.4688e-02   5.7376e-05   17.85   0.09   0.01   0.41 
  1024   7.9930e-03   6.2445e-05   32.80   0.09   0.01   0.40 
  2048   5.6044e-03   8.7569e-05   46.77   0.06   0.00   0.28 
  4096   4.7982e-03   1.4994e-04   54.63   0.04   0.00   0.15 
  8192   4.4476e-03   2.7798e-04   58.94   0.02   0.01   0.08 
  16384   4.3072e-03   5.3840e-04   60.86   0.01   0.00   0.04 
  32768   4.2064e-03   1.0516e-03   62.32   0.01   0.01   0.02 
  65536   4.1844e-03   2.0922e-03   62.65   0.01   0.00   0.01 
  131072   4.1464e-03   4.1464e-03   63.22   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   1   7   9   8   2 
  256   7   8   9   6   1 
  512   6   9   8   1   7 
  1024   7   1   9   6   8 
  2048   9   7   3   2   1 
  4096   9   6   3   8   7 
  8192   1   3   9   2   7 
  16384   6   3   9   2   1 
  32768   6   1   2   3   8 
  65536   6   2   3   7   9 
  131072   9   6   4   3   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   2   7 
  256    2   4   7 
  512    6   7   7 
  1024    6   7   7 
  2048    7   7   7 
  4096    6   7   9 
  8192    7   7   9 
  16384    7   9   9 
  32768    5   9   9 
  65536    6   9   9 
  131072    6   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   4.1904e-02   4.0922e-05   6.26   0.20   0.14   0.60 
  256   2.5557e-02   4.9915e-05   10.26   0.14   0.05   0.49 
  512   1.4714e-02   5.7476e-05   17.82   0.09   0.00   0.40 
  1024   7.9690e-03   6.2258e-05   32.90   0.09   0.01   0.40 
  2048   5.5720e-03   8.7062e-05   47.05   0.07   0.00   0.29 
  4096   4.7464e-03   1.4832e-04   55.23   0.04   0.01   0.15 
  8192   4.4392e-03   2.7745e-04   59.05   0.02   0.00   0.07 
  16384   4.2788e-03   5.3485e-04   61.27   0.01   0.01   0.04 
  32768   4.1912e-03   1.0478e-03   62.55   0.01   0.01   0.02 
  65536   4.1574e-03   2.0787e-03   63.05   0.00   0.00   0.01 
  131072   4.1260e-03   4.1260e-03   63.53   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   1   7   9   8   2 
  256   7   9   8   1   2 
  512   8   2   3   9   1 
  1024   7   1   2   8   3 
  2048   3   1   9   7   6 
  4096   6   3   8   9   7 
  8192   7   1   3   9   8 
  16384   2   3   9   6   8 
  32768   1   6   3   7   2 
  65536   8   9   2   3   6 
  131072   8   9   2   3   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   2   7 
  256    1   4   7 
  512    7   7   7 
  1024    7   7   7 
  2048    7   7   7 
  4096    5   7   9 
  8192    7   7   9 
  16384    7   9   9 
  32768    5   9   9 
  65536    6   9   9 
  131072    5   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   4.1884e-02   4.0902e-05   6.26   0.21   0.16   0.60 
  256   2.5528e-02   4.9859e-05   10.27   0.13   0.05   0.49 
  512   1.4713e-02   5.7474e-05   17.82   0.09   0.00   0.40 
  1024   7.9723e-03   6.2284e-05   32.88   0.09   0.01   0.40 
  2048   5.5843e-03   8.7255e-05   46.94   0.06   0.00   0.29 
  4096   4.7617e-03   1.4880e-04   55.05   0.03   0.00   0.14 
  8192   4.4370e-03   2.7731e-04   59.08   0.02   0.00   0.07 
  16384   4.2723e-03   5.3404e-04   61.36   0.01   0.00   0.04 
  32768   4.1833e-03   1.0458e-03   62.66   0.00   0.00   0.01 
  65536   4.1489e-03   2.0745e-03   63.18   0.00   0.00   0.01 
  131072   4.1310e-03   4.1310e-03   63.46   0.00   0.00   0.00 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   1   7   9   8   2 
  256   7   1   8   9   2 
  512   6   8   3   2   1 
  1024   7   1   6   2   8 
  2048   3   7   1   9   6 
  4096   9   1   3   6   7 
  8192   9   3   6   7   1 
  16384   9   7   3   2   6 
  32768   9   8   2   7   1 
  65536   8   3   6   1   2 
  131072   6   9   3   2   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   2   7 
  256    1   4   7 
  512    7   7   7 
  1024    7   7   7 
  2048    7   7   7 
  4096    7   7   9 
  8192    7   7   9 
  16384    7   9   9 
  32768    7   9   9 
  65536    9   9   9 
  131072    9   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.5967e-02   2.5358e-05   10.10   0.38   0.48   0.80 
  256   1.6439e-02   3.2108e-05   15.95   0.35   0.39   0.75 
  512   1.2557e-02   4.9052e-05   20.88   0.13   0.16   0.35 
  1024   7.6444e-03   5.9722e-05   34.29   0.05   0.05   0.14 
  2048   5.4774e-03   8.5584e-05   47.86   0.03   0.02   0.09 
  4096   4.7502e-03   1.4844e-04   55.19   0.01   0.01   0.03 
  8192   4.4120e-03   2.7575e-04   59.42   0.01   0.01   0.01 
  16384   4.2374e-03   5.2967e-04   61.86   0.01   0.01   0.02 
  32768   4.1736e-03   1.0434e-03   62.81   0.01   0.01   0.02 
  65536   4.1684e-03   2.0842e-03   62.89   0.01   0.00   0.02 
  131072   4.1472e-03   4.1472e-03   63.21   0.00   0.00   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   5   3   2   4   9 
  256   3   5   2   4   9 
  512   3   9   5   8   4 
  1024   5   9   3   4   8 
  2048   5   9   3   8   4 
  4096   9   3   5   2   8 
  8192   5   3   9   7   4 
  16384   1   5   9   8   4 
  32768   1   3   5   9   4 
  65536   3   2   9   7   8 
  131072   4   9   5   2   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    2   4   4 
  256    2   4   4 
  512    3   3   8 
  1024    3   4   9 
  2048    1   7   9 
  4096    3   9   9 
  8192    5   9   9 
  16384    3   9   9 
  32768    2   9   9 
  65536    8   9   9 
  131072    7   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.6126e-02   2.5513e-05   10.03   0.38   0.49   0.88 
  256   1.6496e-02   3.2219e-05   15.89   0.34   0.40   0.67 
  512   1.2747e-02   4.9791e-05   20.57   0.14   0.18   0.31 
  1024   7.8266e-03   6.1145e-05   33.49   0.05   0.04   0.13 
  2048   5.5602e-03   8.6878e-05   47.15   0.02   0.01   0.07 
  4096   4.7558e-03   1.4862e-04   55.12   0.01   0.01   0.03 
  8192   4.4076e-03   2.7548e-04   59.48   0.01   0.01   0.01 
  16384   4.2684e-03   5.3355e-04   61.42   0.00   0.00   0.01 
  32768   4.1494e-03   1.0374e-03   63.18   0.01   0.02   0.02 
  65536   4.1626e-03   2.0813e-03   62.98   0.00   0.01   0.01 
  131072   4.1356e-03   4.1356e-03   63.39   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   3   5   4   2   9 
  256   3   5   4   2   9 
  512   5   3   9   4   7 
  1024   5   3   9   8   4 
  2048   9   3   4   8   2 
  4096   3   8   9   4   5 
  8192   3   5   9   1   4 
  16384   9   3   4   1   5 
  32768   1   9   3   5   6 
  65536   6   3   9   7   2 
  131072   8   9   4   2   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    2   4   4 
  256    2   4   4 
  512    3   3   8 
  1024    2   6   9 
  2048    2   8   9 
  4096    6   9   9 
  8192    4   9   9 
  16384    8   9   9 
  32768    1   9   9 
  65536    9   9   9 
  131072    7   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.7561e-02   2.6916e-05   9.51   0.34   0.50   0.77 
  256   1.7277e-02   3.3744e-05   15.17   0.27   0.39   0.59 
  512   1.3721e-02   5.3599e-05   19.10   0.10   0.11   0.30 
  1024   8.1628e-03   6.3772e-05   32.11   0.02   0.02   0.09 
  2048   5.5942e-03   8.7410e-05   46.86   0.02   0.01   0.06 
  4096   4.7731e-03   1.4916e-04   54.92   0.01   0.00   0.02 
  8192   4.3996e-03   2.7498e-04   59.58   0.01   0.01   0.01 
  16384   4.2212e-03   5.2765e-04   62.10   0.01   0.01   0.02 
  32768   4.1101e-03   1.0275e-03   63.78   0.02   0.02   0.02 
  65536   4.1429e-03   2.0715e-03   63.27   0.00   0.00   0.00 
  131072   4.1279e-03   4.1279e-03   63.51   0.00   0.00   0.00 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   2   4   3   5   9 
  256   4   2   5   3   9 
  512   3   5   9   6   8 
  1024   3   5   6   9   8 
  2048   8   4   6   2   5 
  4096   3   8   9   4   5 
  8192   1   5   9   3   8 
  16384   1   5   9   3   8 
  32768   1   5   8   6   3 
  65536   4   7   1   2   3 
  131072   4   5   8   6   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    4   4   4 
  256    4   4   4 
  512    3   3   8 
  1024    4   8   9 
  2048    4   8   9 
  4096    7   9   9 
  8192    7   9   9 
  16384    1   9   9 
  32768    1   9   9 
  65536    9   9   9 
  131072    9   9   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:01:37 EDT.
86428 accesses since 1/2/96.