COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 128KB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 951.77 9.91 31.4%
1 iter.2176.31 10.03 40.2%
10 iter.2268.15 10.15 36.3%
cache inv. w/overlap 947.23 10.87 25.5%
1 iter. w/overlap2234.44 10.94 35.7%
10 iter. w/overlap2442.49 11.53 34.6%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 949.20 9.43 26.2%
1 iter.2162.90 9.26 35.8%
10 iter.2147.85 9.24 34.5%
cache inv. w/overlap 967.80 9.77 26.8%
1 iter. w/overlap2241.57 9.70 34.0%
10 iter. w/overlap2165.67 9.70 33.1%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 964.38 11.19 35.9%
1 iter.2116.34 11.17 43.5%
10 iter.1882.32 11.19 35.6%
cache inv. w/overlap 961.08 11.68 26.6%
1 iter. w/overlap2214.80 11.70 39.3%
10 iter. w/overlap2416.70 11.79 37.9%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 922.87 16.44 9.0%
1 iter.2260.12 16.55 14.3%
10 iter.2202.57 16.63 24.5%
cache inv. w/overlap 981.52 10.01 7.5%
1 iter. w/overlap2411.78 9.64 11.6%
10 iter. w/overlap2551.86 9.73 17.8%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 932.81 18.17 6.5%
1 iter.2007.23 18.14 18.1%
10 iter.2240.22 18.05 21.8%
cache inv. w/overlap 992.47 11.73 6.5%
1 iter. w/overlap2420.39 11.87 12.1%
10 iter. w/overlap2505.97 11.60 19.4%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 921.96 8.32 27.1%
1 iter.2342.24 8.62 31.7%
10 iter.2300.80 8.25 34.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 958.41 18.98 10.4%
1 iter.2126.18 18.88 16.6%
10 iter.2308.31 18.71 18.4%
cache inv. w/overlap 940.48 19.99 7.2%
1 iter. w/overlap2275.29 19.69 17.1%
10 iter. w/overlap2357.21 19.86 19.8%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 914.33 19.54 12.8%
1 iter.2209.33 20.05 16.9%
10 iter.2129.13 19.48 26.1%
cache inv. w/overlap 928.40 21.24 10.6%
1 iter. w/overlap2261.94 20.97 18.1%
10 iter. w/overlap2117.02 20.88 30.6%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 925.21 24.12 16.0%
1 iter.2191.35 23.50 19.6%
10 iter.1913.81 24.06 17.6%
cache inv. w/overlap 965.75 25.31 19.1%
1 iter. w/overlap2179.69 24.99 25.2%
10 iter. w/overlap2207.62 24.41 33.0%


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.7370e-03   8.5322e-06   30.00   0.81   0.97   1.86 
  256   4.4784e-03   8.7468e-06   58.54   0.80   0.97   1.82 
  512   2.4841e-03   9.7036e-06   105.53   0.74   0.90   1.62 
  1024   1.4114e-03   1.1027e-05   185.73   0.66   0.80   1.38 
  2048   8.5036e-04   1.3287e-05   308.27   0.55   0.65   1.19 
  4096   5.5815e-04   1.7442e-05   469.67   0.44   0.51   1.03 
  8192   5.3996e-04   3.3748e-05   485.49   0.13   0.07   0.38 
  16384   4.0659e-04   5.0823e-05   644.74   0.07   0.05   0.30 
  32768   3.2352e-04   8.0880e-05   810.29   0.09   0.05   0.40 
  65536   2.8737e-04   1.4369e-04   912.21   0.04   0.04   0.06 
  131072   2.6793e-04   2.6793e-04   978.39   0.03   0.03   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   1   3   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   5   6   7   2 
  16384   6   4   8   7   2 
  32768   8   2   6   4   1 
  65536   7   4   1   2   9 
  131072   6   3   5   2   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   4 
  4096    1   1   4 
  8192    1   2   7 
  16384    2   5   8 
  32768    1   4   8 
  65536    1   5   9 
  131072    2   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.7822e-03   8.5764e-06   29.85   0.78   0.95   1.80 
  256   4.3679e-03   8.5311e-06   60.02   0.81   0.97   1.87 
  512   2.2510e-03   8.7930e-06   116.46   0.80   0.97   1.81 
  1024   1.2032e-03   9.3998e-06   217.88   0.74   0.92   1.65 
  2048   6.5044e-04   1.0163e-05   403.03   0.68   0.85   1.51 
  4096   3.7247e-04   1.1640e-05   703.81   0.65   0.72   1.44 
  8192   3.5452e-04   2.2158e-05   739.43   0.25   0.21   0.51 
  16384   2.4375e-04   3.0468e-05   1075.48   0.13   0.09   0.45 
  32768   1.6948e-04   4.2370e-05   1546.75   0.09   0.04   0.29 
  65536   1.3080e-04   6.5400e-05   2004.16   0.07   0.08   0.14 
  131072   1.1457e-04   1.1457e-04   2288.00   0.12   0.11   0.35 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   1   3   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   1   3   4 
  4096   6   2   3   1   4 
  8192   6   4   5   2   8 
  16384   5   4   2   8   6 
  32768   6   7   2   4   5 
  65536   6   3   8   9   4 
  131072   2   9   3   6   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   2 
  8192    1   1   6 
  16384    1   3   8 
  32768    2   6   8 
  65536    1   1   9 
  131072    1   1   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.5632e-03   8.3625e-06   30.61   0.82   1.00   1.89 
  256   4.3374e-03   8.4716e-06   60.44   0.82   0.99   1.86 
  512   2.2218e-03   8.6789e-06   117.99   0.81   0.98   1.86 
  1024   1.1595e-03   9.0584e-06   226.09   0.78   0.93   1.79 
  2048   6.2315e-04   9.7367e-06   420.68   0.73   0.88   1.63 
  4096   3.6031e-04   1.1260e-05   727.54   0.65   0.73   1.44 
  8192   3.5293e-04   2.2058e-05   742.77   0.19   0.18   0.40 
  16384   2.2043e-04   2.7554e-05   1189.22   0.18   0.11   0.51 
  32768   1.4905e-04   3.7264e-05   1758.71   0.20   0.10   0.61 
  65536   1.2213e-04   6.1064e-05   2146.47   0.10   0.03   0.43 
  131072   1.1318e-04   1.1318e-04   2316.25   0.08   0.06   0.20 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   1   3   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   6   5   2   8 
  16384   4   6   5   2   8 
  32768   4   6   5   2   7 
  65536   6   4   1   5   2 
  131072   4   5   7   2   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   2 
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   7 
  16384    1   2   7 
  32768    1   1   7 
  65536    1   6   7 
  131072    1   3   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   9.2181e-03   9.0020e-06   28.44   0.63   0.34   1.82 
  256   4.8071e-03   9.3889e-06   54.53   0.60   0.33   1.71 
  512   2.7057e-03   1.0569e-05   96.89   0.52   0.29   1.50 
  1024   1.4777e-03   1.1545e-05   177.39   0.50   0.28   1.28 
  2048   8.9221e-04   1.3941e-05   293.81   0.37   0.21   1.06 
  4096   5.6440e-04   1.7637e-05   464.46   0.33   0.17   0.95 
  8192   4.1237e-04   2.5773e-05   635.70   0.41   0.47   0.77 
  16384   3.3895e-04   4.2368e-05   773.41   0.26   0.26   0.73 
  32768   2.9336e-04   7.3340e-05   893.59   0.14   0.18   0.22 
  65536   2.6708e-04   1.3354e-04   981.52   0.10   0.11   0.18 
  131072   2.6763e-04   2.6763e-04   979.51   0.03   0.02   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   1   3 
  256   6   2   4   1   3 
  512   6   2   4   1   5 
  1024   6   4   2   1   5 
  2048   6   4   2   1   5 
  4096   6   2   4   5   3 
  8192   4   5   2   6   8 
  16384   4   5   8   6   1 
  32768   4   5   2   8   1 
  65536   4   5   6   8   2 
  131072   2   5   9   6   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   4 
  1024    1   1   4 
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   2 
  16384    1   1   4 
  32768    1   2   9 
  65536    1   2   9 
  131072    1   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.9971e-03   8.7863e-06   29.14   0.64   0.34   1.87 
  256   4.6469e-03   9.0759e-06   56.41   0.60   0.31   1.79 
  512   2.2869e-03   8.9334e-06   114.63   0.67   0.37   1.90 
  1024   1.2231e-03   9.5554e-06   214.33   0.62   0.36   1.70 
  2048   6.5101e-04   1.0172e-05   402.67   0.59   0.34   1.59 
  4096   3.6951e-04   1.1547e-05   709.44   0.54   0.32   1.35 
  8192   2.5427e-04   1.5892e-05   1030.98   0.63   0.70   0.98 
  16384   1.8561e-04   2.3202e-05   1412.31   0.36   0.35   0.70 
  32768   1.3192e-04   3.2980e-05   1987.14   0.33   0.38   0.56 
  65536   1.1495e-04   5.7473e-05   2280.57   0.14   0.18   0.21 
  131072   1.1333e-04   1.1333e-04   2313.04   0.10   0.06   0.42 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   1   3 
  256   6   2   4   1   3 
  512   6   2   4   1   5 
  1024   6   2   4   3   1 
  2048   6   2   4   3   5 
  4096   6   2   4   3   5 
  8192   4   5   2   6   8 
  16384   4   5   2   6   8 
  32768   4   5   6   2   8 
  65536   4   5   2   1   9 
  131072   5   9   4   2   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   9 
  131072    3   4   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   9.0655e-03   8.8530e-06   28.92   0.63   0.34   1.79 
  256   4.5672e-03   8.9203e-06   57.40   0.63   0.33   1.80 
  512   2.2907e-03   8.9479e-06   114.44   0.65   0.36   1.82 
  1024   1.1948e-03   9.3346e-06   219.40   0.64   0.36   1.76 
  2048   6.3832e-04   9.9738e-06   410.68   0.60   0.35   1.61 
  4096   3.5918e-04   1.1224e-05   729.85   0.54   0.32   1.37 
  8192   2.4202e-04   1.5126e-05   1083.15   0.65   0.76   1.00 
  16384   1.5793e-04   1.9741e-05   1659.92   0.50   0.61   0.75 
  32768   1.2076e-04   3.0191e-05   2170.71   0.33   0.37   0.49 
  65536   1.0370e-04   5.1851e-05   2527.84   0.17   0.21   0.22 
  131072   1.0330e-04   1.0330e-04   2537.63   0.10   0.12   0.18 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   5   1 
  256   6   2   4   5   3 
  512   6   2   4   5   3 
  1024   6   2   4   5   3 
  2048   6   2   4   5   3 
  4096   6   2   4   5   1 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   2   6   8 
  65536   4   5   3   6   2 
  131072   5   4   3   9   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   9 
  131072    2   2   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:43 EDT.
2808 accesses since 1/2/96.