COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 128KB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 16, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 797.50 11.56 36.5%
1 iter.1707.11 11.68 49.1%
10 iter.2164.61 11.76 44.9%
cache inv. w/overlap 796.75 12.15 33.7%
1 iter. w/overlap1873.10 11.90 48.3%
10 iter. w/overlap2115.87 11.15 49.9%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 806.68 9.87 36.0%
1 iter.1820.38 9.27 49.5%
10 iter.2008.03 9.79 46.6%
cache inv. w/overlap 827.01 10.43 38.8%
1 iter. w/overlap1770.55 9.96 47.1%
10 iter. w/overlap2021.16 9.84 48.4%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 819.20 11.80 48.0%
1 iter.1808.41 11.85 48.4%
10 iter.1817.83 11.96 47.0%
cache inv. w/overlap 827.01 13.41 38.5%
1 iter. w/overlap1873.10 12.76 47.5%
10 iter. w/overlap2134.77 12.40 46.5%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 799.93 18.23 5.7%
1 iter.1684.30 18.05 19.9%
10 iter.2057.66 17.54 19.6%
cache inv. w/overlap 837.56 11.13 7.7%
1 iter. w/overlap1986.47 10.26 10.4%
10 iter. w/overlap2261.90 10.09 17.4%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 799.35 20.21 6.6%
1 iter.1779.74 20.18 13.7%
10 iter.2075.53 20.09 18.5%
cache inv. w/overlap 848.39 13.11 5.7%
1 iter. w/overlap1923.38 13.60 11.7%
10 iter. w/overlap2249.31 12.53 18.0%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 840.28 8.53 41.4%
1 iter.1748.03 8.20 48.7%
10 iter.1951.15 8.27 52.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 816.57 23.91 13.8%
1 iter.1751.52 23.01 28.7%
10 iter.2192.01 23.05 19.3%
cache inv. w/overlap 791.94 25.17 9.3%
1 iter. w/overlap1770.55 24.22 17.7%
10 iter. w/overlap2132.90 24.27 22.1%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 800.23 23.01 8.1%
1 iter.1820.38 21.32 14.8%
10 iter.2055.93 21.85 23.5%
cache inv. w/overlap 806.68 22.20 10.4%
1 iter. w/overlap1825.52 23.84 16.6%
10 iter. w/overlap1979.85 23.12 29.3%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 830.27 25.91 19.4%
1 iter.1844.82 26.12 21.5%
10 iter.1928.97 26.02 19.1%
cache inv. w/overlap 827.01 27.06 17.8%
1 iter. w/overlap1837.80 26.85 22.0%
10 iter. w/overlap2103.59 26.65 24.3%


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   9.2100e-03   8.9941e-06   28.46   0.94   1.04   2.02 
  256   4.8450e-03   9.4629e-06   54.11   0.89   0.95   2.00 
  512   2.8509e-03   1.1136e-05   91.95   0.70   0.80   1.53 
  1024   1.6270e-03   1.2711e-05   161.12   0.63   0.67   1.43 
  2048   9.5713e-04   1.4955e-05   273.88   0.56   0.60   1.23 
  4096   9.1898e-04   2.8718e-05   285.25   0.17   0.12   0.46 
  8192   6.1393e-04   3.8370e-05   426.99   0.17   0.12   0.48 
  16384   4.5021e-04   5.6277e-05   582.27   0.13   0.06   0.50 
  32768   3.7897e-04   9.4742e-05   691.73   0.05   0.06   0.08 
  65536   3.3295e-04   1.6648e-04   787.33   0.04   0.04   0.07 
  131072   3.1602e-04   3.1602e-04   829.51   0.04   0.04   0.10 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   1   3   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   1   3   4 
  4096   4   5   6   2   8 
  8192   4   5   2   6   8 
  16384   7   4   6   8   2 
  32768   4   6   3   1   2 
  65536   6   3   7   2   1 
  131072   8   7   1   3   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   2 
  256    1   1   2 
  512    1   1   3 
  1024    1   2   4 
  2048    1   2   4 
  4096    1   1   7 
  8192    1   2   7 
  16384    1   3   7 
  32768    1   4   9 
  65536    2   6   9 
  131072    2   5   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.9170e-03   8.7080e-06   29.40   0.94   1.03   2.04 
  256   4.7185e-03   9.2158e-06   55.56   0.86   0.89   1.90 
  512   2.4240e-03   9.4688e-06   108.15   0.86   0.90   1.97 
  1024   1.3100e-03   1.0234e-05   200.11   0.79   0.87   1.64 
  2048   7.3004e-04   1.1407e-05   359.08   0.71   0.84   1.48 
  4096   6.8400e-04   2.1375e-05   383.25   0.31   0.29   0.51 
  8192   4.2701e-04   2.6688e-05   613.91   0.15   0.15   0.30 
  16384   2.7394e-04   3.4243e-05   956.93   0.12   0.10   0.39 
  32768   1.9002e-04   4.7505e-05   1379.56   0.10   0.10   0.19 
  65536   1.5092e-04   7.5459e-05   1736.99   0.07   0.09   0.14 
  131072   1.4591e-04   1.4591e-04   1796.59   0.15   0.19   0.34 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   3   1   4 
  256   6   2   3   1   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   3   1   4 
  4096   4   5   6   2   8 
  8192   4   6   5   8   2 
  16384   4   8   6   5   1 
  32768   4   7   1   8   5 
  65536   2   7   1   9   8 
  131072   2   8   9   7   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   2 
  256    1   1   2 
  512    1   1   2 
  1024    1   1   2 
  2048    1   1   4 
  4096    1   1   3 
  8192    1   2   7 
  16384    2   3   8 
  32768    1   1   9 
  65536    2   3   9 
  131072    1   2   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.7656e-03   8.5602e-06   29.91   0.98   1.06   2.11 
  256   4.5301e-03   8.8479e-06   57.87   0.94   1.01   2.08 
  512   2.2860e-03   8.9297e-06   114.67   0.96   1.07   2.07 
  1024   1.2173e-03   9.5101e-06   215.35   0.89   0.97   1.87 
  2048   6.8785e-04   1.0748e-05   381.11   0.75   0.82   1.60 
  4096   6.5351e-04   2.0422e-05   401.14   0.30   0.30   0.52 
  8192   3.8741e-04   2.4213e-05   676.66   0.22   0.21   0.47 
  16384   2.4336e-04   3.0420e-05   1077.18   0.20   0.13   0.57 
  32768   1.7080e-04   4.2701e-05   1534.77   0.17   0.08   0.58 
  65536   1.3581e-04   6.7903e-05   1930.27   0.10   0.03   0.42 
  131072   1.2569e-04   1.2569e-04   2085.57   0.05   0.02   0.22 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   1   3   4 
  256   6   2   3   1   4 
  512   6   2   1   3   4 
  1024   6   2   1   3   4 
  2048   6   2   3   1   4 
  4096   4   5   2   8   6 
  8192   4   5   6   8   2 
  16384   4   5   6   2   8 
  32768   4   6   2   5   8 
  65536   4   6   8   2   7 
  131072   7   5   2   4   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   2 
  256    1   1   2 
  512    1   1   2 
  1024    1   1   2 
  2048    1   1   2 
  4096    1   1   2 
  8192    1   1   6 
  16384    1   2   7 
  32768    1   3   7 
  65536    1   7   7 
  131072    3   6   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   9.6691e-03   9.4424e-06   27.11   0.73   0.41   1.96 
  256   5.0470e-03   9.8574e-06   51.94   0.70   0.33   1.93 
  512   2.9960e-03   1.1703e-05   87.50   0.57   0.28   1.53 
  1024   1.6010e-03   1.2508e-05   163.74   0.56   0.27   1.48 
  2048   9.9301e-04   1.5516e-05   263.99   0.42   0.17   1.22 
  4096   6.4492e-04   2.0154e-05   406.47   0.60   0.65   0.98 
  8192   4.8697e-04   3.0436e-05   538.32   0.40   0.39   0.87 
  16384   3.9547e-04   4.9433e-05   662.87   0.27   0.23   0.59 
  32768   3.3195e-04   8.2987e-05   789.72   0.17   0.17   0.46 
  65536   3.1507e-04   1.5754e-04   832.02   0.06   0.08   0.11 
  131072   3.1373e-04   3.1373e-04   835.56   0.04   0.04   0.10 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   1   3 
  256   6   2   4   1   3 
  512   6   2   4   1   3 
  1024   6   2   4   1   5 
  2048   6   4   2   1   3 
  4096   4   5   6   8   2 
  8192   4   5   6   8   2 
  16384   4   5   2   8   6 
  32768   4   5   6   2   8 
  65536   4   5   2   6   1 
  131072   4   8   9   3   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   4 
  1024    1   1   4 
  2048    1   3   6 
  4096    1   1   2 
  8192    1   2   2 
  16384    1   2   6 
  32768    1   1   8 
  65536    1   3   9 
  131072    1   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   9.5180e-03   9.2949e-06   27.54   0.73   0.36   1.97 
  256   4.6970e-03   9.1738e-06   55.81   0.77   0.41   2.09 
  512   2.5760e-03   1.0062e-05   101.76   0.67   0.31   1.78 
  1024   1.4060e-03   1.0984e-05   186.45   0.58   0.30   1.71 
  2048   7.6389e-04   1.1936e-05   343.17   0.54   0.25   1.42 
  4096   4.9198e-04   1.5374e-05   532.84   0.77   0.84   1.14 
  8192   3.0273e-04   1.8921e-05   865.92   0.57   0.66   0.89 
  16384   2.1899e-04   2.7373e-05   1197.07   0.34   0.37   0.74 
  32768   1.7297e-04   4.3243e-05   1515.52   0.18   0.21   0.30 
  65536   1.4473e-04   7.2367e-05   1811.22   0.12   0.15   0.20 
  131072   1.4699e-04   1.4699e-04   1783.47   0.10   0.06   0.39 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   1   3 
  256   6   2   4   3   5 
  512   6   4   2   1   3 
  1024   6   4   2   1   3 
  2048   6   2   4   1   3 
  4096   4   5   6   2   8 
  8192   4   5   2   6   8 
  16384   4   5   2   6   9 
  32768   5   4   6   9   2 
  65536   4   5   3   6   1 
  131072   9   5   3   6   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   2   4 
  2048    1   2   5 
  4096    1   1   2 
  8192    1   2   2 
  16384    1   2   2 
  32768    1   2   6 
  65536    1   1   9 
  131072    1   4   8 


Protocol Sensitivity Summary for Bidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   8.7524e-03   8.5473e-06   29.95   0.82   0.46   2.14 
  256   4.4376e-03   8.6672e-06   59.07   0.82   0.44   2.12 
  512   2.4222e-03   9.4617e-06   108.23   0.72   0.36   1.92 
  1024   1.2434e-03   9.7141e-06   210.83   0.72   0.38   1.83 
  2048   6.8740e-04   1.0741e-05   381.36   0.64   0.35   1.66 
  4096   4.2770e-04   1.3366e-05   612.92   0.91   1.02   1.27 
  8192   2.5671e-04   1.6044e-05   1021.19   0.77   0.89   1.09 
  16384   1.8237e-04   2.2796e-05   1437.45   0.46   0.56   0.65 
  32768   1.3900e-04   3.4750e-05   1885.95   0.30   0.35   0.48 
  65536   1.1590e-04   5.7948e-05   2261.90   0.17   0.20   0.23 
  131072   1.1530e-04   1.1530e-04   2273.60   0.09   0.09   0.22 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   6   2   4   1   3 
  256   6   2   4   1   5 
  512   6   2   4   1   3 
  1024   6   4   2   1   5 
  2048   6   2   4   1   3 
  4096   4   5   6   2   8 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   6   2   8 
  65536   4   5   6   8   1 
  131072   4   5   8   3   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   3 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   2 
  65536    1   2   9 
  131072    1   2   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:22:15 EDT.
86219 accesses since 1/2/96.