COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 128KB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 961.41 11.05 25.0%
1 iter.2186.72 11.05 32.5%
10 iter.2360.75 10.99 31.5%
cache inv. w/overlap 978.73 11.17 21.9%
1 iter. w/overlap2245.15 11.21 34.7%
10 iter. w/overlap2361.86 11.38 33.3%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 978.05 9.65 27.9%
1 iter.2157.68 9.28 31.3%
10 iter.2225.81 9.45 35.0%
cache inv. w/overlap 967.80 9.50 23.3%
1 iter. w/overlap2181.62 9.34 33.5%
10 iter. w/overlap2169.90 9.48 35.8%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 949.52 11.25 31.9%
1 iter.2227.35 11.57 37.5%
10 iter.2049.24 11.28 37.5%
cache inv. w/overlap1005.10 11.43 34.1%
1 iter. w/overlap2346.44 11.10 38.8%
10 iter. w/overlap2365.64 11.30 37.2%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 957.38 16.27 7.2%
1 iter.2145.91 16.35 18.2%
10 iter.2312.38 16.24 19.9%
cache inv. w/overlap 975.96 9.77 5.7%
1 iter. w/overlap2292.00 9.86 16.0%
10 iter. w/overlap2518.45 9.54 18.3%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 901.79 18.46 8.9%
1 iter.2198.95 18.87 15.8%
10 iter.2321.83 18.49 17.0%
cache inv. w/overlap1011.72 11.21 8.2%
1 iter. w/overlap2289.87 11.69 11.8%
10 iter. w/overlap2507.92 11.41 17.2%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 942.96 7.99 27.1%
1 iter.2346.16 7.88 41.8%
10 iter.2272.77 7.97 38.7%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 957.71 19.35 7.1%
1 iter.2376.79 19.45 17.6%
10 iter.2360.95 19.02 21.1%
cache inv. w/overlap 938.87 18.77 8.9%
1 iter. w/overlap2288.00 19.73 17.2%
10 iter. w/overlap2356.53 19.82 19.1%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 934.72 20.34 14.5%
1 iter.2267.42 18.79 16.3%
10 iter.2212.73 19.66 26.0%
cache inv. w/overlap 977.37 19.53 7.3%
1 iter. w/overlap2109.98 19.81 21.7%
10 iter. w/overlap2173.47 19.51 27.4%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 959.06 23.54 13.2%
1 iter.2280.57 23.77 20.7%
10 iter.1962.35 23.64 23.7%
cache inv. w/overlap1047.35 24.17 11.4%
1 iter. w/overlap2274.77 23.95 20.8%
10 iter. w/overlap2210.99 23.89 31.1%


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.6369e-03   8.4345e-06   30.35   0.86   1.01   1.83 
  256   4.5458e-03   8.8785e-06   57.67   0.80   0.99   1.73 
  512   2.5654e-03   1.0021e-05   102.18   0.69   0.83   1.46 
  1024   1.4849e-03   1.1601e-05   176.53   0.58   0.71   1.21 
  2048   8.8260e-04   1.3791e-05   297.01   0.48   0.56   0.99 
  4096   5.3929e-04   1.6853e-05   486.09   0.46   0.48   0.94 
  8192   5.1956e-04   3.2472e-05   504.55   0.16   0.13   0.44 
  16384   3.8345e-04   4.7932e-05   683.64   0.12   0.09   0.33 
  32768   3.1649e-04   7.9123e-05   828.28   0.08   0.08   0.15 
  65536   2.8376e-04   1.4188e-04   923.82   0.04   0.04   0.08 
  131072   2.6177e-04   2.6177e-04   1001.42   0.04   0.05   0.09 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   1   3   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   1   3   4 
  4096   6   2   3   1   4 
  8192   4   6   5   8   2 
  16384   4   8   6   5   7 
  32768   4   6   5   2   7 
  65536   3   6   1   8   7 
  131072   1   2   4   6   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   2 
  256    1   1   2 
  512    1   1   3 
  1024    1   1   4 
  2048    1   1   4 
  4096    1   1   4 
  8192    1   1   7 
  16384    2   2   7 
  32768    1   1   9 
  65536    2   6   9 
  131072    3   4   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.3243e-03   8.1292e-06   31.49   0.90   1.04   1.94 
  256   4.2873e-03   8.3736e-06   61.14   0.87   1.01   1.86 
  512   2.2941e-03   8.9615e-06   114.27   0.79   0.90   1.74 
  1024   1.1907e-03   9.3022e-06   220.16   0.78   0.94   1.65 
  2048   6.4456e-04   1.0071e-05   406.70   0.73   0.83   1.52 
  4096   3.8573e-04   1.2054e-05   679.60   0.58   0.60   1.33 
  8192   3.6411e-04   2.2757e-05   719.96   0.18   0.20   0.37 
  16384   2.4384e-04   3.0480e-05   1075.07   0.13   0.06   0.45 
  32768   1.5867e-04   3.9667e-05   1652.17   0.12   0.10   0.29 
  65536   1.3003e-04   6.5013e-05   2016.08   0.06   0.04   0.12 
  131072   1.1475e-04   1.1475e-04   2284.55   0.09   0.05   0.40 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   3   1   4 
  512   6   2   1   3   4 
  1024   6   2   3   1   4 
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   2   5   6   8 
  16384   5   4   2   8   6 
  32768   4   8   6   5   7 
  65536   3   7   1   8   5 
  131072   9   6   8   4   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   2 
  256    1   1   2 
  512    1   1   2 
  1024    1   1   2 
  2048    1   1   2 
  4096    1   1   4 
  8192    1   1   7 
  16384    2   4   7 
  32768    1   1   8 
  65536    1   5   9 
  131072    2   5   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.3139e-03   8.1190e-06   31.53   0.90   1.03   1.94 
  256   4.2357e-03   8.2729e-06   61.89   0.89   1.02   1.90 
  512   2.2013e-03   8.5987e-06   119.09   0.85   0.99   1.84 
  1024   1.1498e-03   8.9831e-06   227.98   0.82   0.96   1.73 
  2048   6.1685e-04   9.6383e-06   424.97   0.77   0.91   1.58 
  4096   3.5852e-04   1.1204e-05   731.18   0.65   0.76   1.41 
  8192   3.5897e-04   2.2435e-05   730.27   0.18   0.17   0.37 
  16384   2.1942e-04   2.7428e-05   1194.69   0.19   0.14   0.52 
  32768   1.4900e-04   3.7250e-05   1759.37   0.20   0.09   0.65 
  65536   1.2163e-04   6.0815e-05   2155.27   0.07   0.03   0.30 
  131072   1.0994e-04   1.0994e-04   2384.37   0.08   0.04   0.25 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   3   1   4 
  512   6   2   3   1   4 
  1024   6   2   3   1   4 
  2048   6   2   3   1   4 
  4096   6   2   3   1   4 
  8192   4   5   6   2   7 
  16384   4   6   5   1   8 
  32768   4   2   6   8   5 
  65536   4   6   2   7   1 
  131072   7   4   5   8   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   2 
  256    1   1   2 
  512    1   1   2 
  1024    1   1   2 
  2048    1   1   2 
  4096    1   1   2 
  8192    1   1   7 
  16384    1   1   7 
  32768    1   1   7 
  65536    1   6   8 
  131072    1   5   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.9996e-03   8.7887e-06   29.13   0.61   0.34   1.78 
  256   4.6410e-03   9.0645e-06   56.48   0.61   0.34   1.73 
  512   2.6508e-03   1.0355e-05   98.89   0.51   0.29   1.48 
  1024   1.4264e-03   1.1144e-05   183.78   0.49   0.29   1.33 
  2048   8.5407e-04   1.3345e-05   306.94   0.39   0.19   1.07 
  4096   5.7465e-04   1.7958e-05   456.18   0.27   0.11   0.82 
  8192   4.1513e-04   2.5946e-05   631.47   0.37   0.38   0.73 
  16384   3.4039e-04   4.2548e-05   770.14   0.21   0.21   0.46 
  32768   2.8468e-04   7.1170e-05   920.84   0.16   0.16   0.38 
  65536   2.6908e-04   1.3454e-04   974.22   0.08   0.09   0.16 
  131072   2.5295e-04   2.5295e-04   1036.36   0.05   0.03   0.11 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   1   3 
  256   6   2   4   1   3 
  512   6   2   4   1   5 
  1024   6   2   4   1   5 
  2048   6   2   4   1   3 
  4096   6   4   2   5   1 
  8192   4   5   2   6   1 
  16384   4   5   2   6   8 
  32768   5   4   8   6   7 
  65536   5   6   4   3   7 
  131072   5   9   3   2   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   4 
  1024    1   1   4 
  2048    1   1   6 
  4096    2   2   6 
  8192    1   1   2 
  16384    1   2   5 
  32768    1   2   8 
  65536    1   3   9 
  131072    1   6   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.7950e-03   8.5889e-06   29.81   0.63   0.34   1.82 
  256   4.3447e-03   8.4857e-06   60.34   0.67   0.39   1.89 
  512   2.2977e-03   8.9754e-06   114.09   0.62   0.35   1.77 
  1024   1.2013e-03   9.3848e-06   218.23   0.59   0.33   1.65 
  2048   6.5600e-04   1.0250e-05   399.61   0.55   0.29   1.50 
  4096   3.6828e-04   1.1509e-05   711.81   0.53   0.29   1.34 
  8192   2.5332e-04   1.5833e-05   1034.83   0.55   0.58   0.90 
  16384   1.7035e-04   2.1293e-05   1538.89   0.49   0.53   0.89 
  32768   1.3459e-04   3.3647e-05   1947.77   0.29   0.33   0.47 
  65536   1.1560e-04   5.7800e-05   2267.68   0.15   0.17   0.23 
  131072   1.1049e-04   1.1049e-04   2372.49   0.13   0.09   0.48 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   3   1 
  256   6   2   4   5   3 
  512   6   2   4   1   3 
  1024   6   2   4   1   5 
  2048   6   2   4   5   1 
  4096   6   2   4   5   1 
  8192   4   5   6   8   7 
  16384   4   5   6   8   1 
  32768   4   5   2   7   6 
  65536   4   5   2   8   6 
  131072   5   4   9   8   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   3 
  65536    1   1   9 
  131072    1   2   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.6889e-03   8.4853e-06   30.17   0.65   0.36   1.82 
  256   4.3707e-03   8.5365e-06   59.98   0.65   0.36   1.81 
  512   2.2644e-03   8.8452e-06   115.77   0.63   0.35   1.74 
  1024   1.1740e-03   9.1715e-06   223.30   0.62   0.34   1.69 
  2048   6.2910e-04   9.8297e-06   416.70   0.58   0.31   1.57 
  4096   3.5886e-04   1.1214e-05   730.49   0.51   0.28   1.39 
  8192   2.3462e-04   1.4664e-05   1117.31   0.67   0.81   0.98 
  16384   1.5957e-04   1.9946e-05   1642.81   0.49   0.55   0.77 
  32768   1.2239e-04   3.0599e-05   2141.79   0.31   0.35   0.46 
  65536   1.0409e-04   5.2045e-05   2518.45   0.17   0.21   0.22 
  131072   1.0375e-04   1.0375e-04   2526.58   0.10   0.11   0.19 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   3   5 
  256   6   2   4   3   5 
  512   6   2   4   3   5 
  1024   6   4   2   3   5 
  2048   6   2   4   5   3 
  4096   6   2   4   5   3 
  8192   4   5   6   8   2 
  16384   4   5   6   2   8 
  32768   4   5   8   6   2 
  65536   4   5   6   8   2 
  131072   4   5   7   1   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   9 
  131072    2   2   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:38 EDT.
81543 accesses since 1/2/96.