COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 2MB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 865.07 10.04 33.1%
1 iter. 891.57 10.06 33.2%
10 iter.1327.34 9.99 33.6%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 865.36 12.71 31.4%
1 iter. 900.39 12.70 31.8%
10 iter.1276.47 12.52 31.2%
cache inv. w/overlap 867.28 12.86 32.1%
1 iter. w/overlap 877.67 12.92 30.9%
10 iter. w/overlap1280.93 12.47 31.8%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 873.40 10.94 33.1%
1 iter. 904.72 11.04 33.0%
10 iter.1310.17 10.81 32.8%
cache inv. w/overlap 868.21 11.36 32.3%
1 iter. w/overlap 889.02 11.47 31.1%
10 iter. w/overlap1305.30 10.88 32.8%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 862.36 13.72 30.3%
1 iter. 896.29 13.89 31.0%
10 iter.1272.11 13.32 31.1%
cache inv. w/overlap 866.46 13.79 31.2%
1 iter. w/overlap 885.79 13.86 30.8%
10 iter. w/overlap1267.87 13.49 31.0%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 873.32 15.24 24.5%
1 iter. 897.94 15.37 22.8%
10 iter.1339.35 15.29 34.0%
cache inv. w/overlap 874.16 11.07 26.7%
1 iter. w/overlap 900.28 11.34 25.9%
10 iter. w/overlap1398.16 10.75 36.6%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 864.11 17.42 22.6%
1 iter. 890.63 17.03 23.2%
10 iter.1301.83 16.76 31.8%
cache inv. w/overlap 864.64 13.88 24.0%
1 iter. w/overlap 899.72 13.86 24.5%
10 iter. w/overlap1344.37 13.42 34.2%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 866.68 14.33 28.7%
1 iter. 892.90 14.05 29.4%
10 iter.1291.22 14.08 32.0%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 864.78 19.29 22.4%
1 iter. 892.80 19.22 21.8%
10 iter.1282.94 18.52 31.2%
cache inv. w/overlap 869.50 19.27 21.4%
1 iter. w/overlap 884.53 19.19 21.4%
10 iter. w/overlap1277.43 18.91 30.7%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 857.74 16.82 23.1%
1 iter. 897.31 16.85 22.8%
10 iter.1321.31 16.37 33.1%
cache inv. w/overlap 873.23 16.80 23.9%
1 iter. w/overlap 892.95 17.01 23.0%
10 iter. w/overlap1319.78 16.42 33.1%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 862.28 20.00 21.7%
1 iter. 896.60 19.82 22.7%
10 iter.1263.71 19.57 30.1%
cache inv. w/overlap 858.93 20.27 21.1%
1 iter. w/overlap 902.51 20.35 22.3%
10 iter. w/overlap1267.22 19.92 30.4%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 865.32 15.78 23.8%
1 iter. 896.16 16.17 23.5%
10 iter.1347.96 14.96 34.4%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.7328e-02   2.6688e-05   153.48   0.38   0.36   0.74 
  4096   1.7047e-02   3.3295e-05   246.04   0.30   0.27   0.59 
  8192   1.4346e-02   5.6038e-05   292.37   0.11   0.11   0.19 
  16384   1.0675e-02   8.3398e-05   392.91   0.07   0.06   0.13 
  32768   8.9447e-03   1.3976e-04   468.91   0.03   0.03   0.06 
  65536   7.1843e-03   2.2451e-04   583.81   0.02   0.02   0.04 
  131072   5.9561e-03   3.7226e-04   704.20   0.03   0.03   0.04 
  262144   5.5015e-03   6.8768e-04   762.40   0.01   0.01   0.04 
  524288   5.1680e-03   1.2920e-03   811.59   0.02   0.02   0.04 
  1048576   4.9578e-03   2.4789e-03   846.01   0.01   0.01   0.02 
  2097152   4.7557e-03   4.7557e-03   881.96   0.02   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   10   0   8   2 
  16384   4   0   10   8   2 
  32768   4   10   0   5   8 
  65536   4   2   0   5   10 
  131072   4   10   1   0   2 
  262144   6   0   10   4   5 
  524288   6   10   0   8   2 
  1048576   10   3   9   1   5 
  2097152   1   5   2   4   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   5 
  8192    1   3   11 
  16384    1   4   11 
  32768    3   7   11 
  65536    2   11   11 
  131072    1   11   11 
  262144    6   11   11 
  524288    2   11   11 
  1048576    6   11   11 
  2097152    3   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.7252e-02   2.6613e-05   153.91   0.37   0.36   0.74 
  4096   1.6947e-02   3.3100e-05   247.49   0.29   0.26   0.60 
  8192   1.4022e-02   5.4774e-05   299.12   0.11   0.10   0.20 
  16384   1.0456e-02   8.1689e-05   401.13   0.08   0.07   0.14 
  32768   8.5997e-03   1.3437e-04   487.73   0.05   0.05   0.09 
  65536   6.8732e-03   2.1479e-04   610.24   0.04   0.04   0.06 
  131072   5.7814e-03   3.6134e-04   725.49   0.03   0.03   0.05 
  262144   5.3354e-03   6.6692e-04   786.13   0.02   0.02   0.04 
  524288   5.0578e-03   1.2645e-03   829.27   0.02   0.01   0.04 
  1048576   4.7970e-03   2.3985e-03   874.36   0.02   0.02   0.03 
  2097152   4.5379e-03   4.5379e-03   924.29   0.01   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   10   0   2   8 
  16384   4   0   10   8   2 
  32768   4   0   10   8   5 
  65536   4   0   10   2   8 
  131072   8   4   0   5   10 
  262144   0   4   8   1   10 
  524288   0   8   2   5   7 
  1048576   0   1   3   7   10 
  2097152   6   4   5   8   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   5 
  8192    1   2   11 
  16384    1   3   11 
  32768    1   6   11 
  65536    1   8   11 
  131072    2   9   11 
  262144    3   11   11 
  524288    5   11   11 
  1048576    1   11   11 
  2097152    5   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2462e-02   2.1936e-05   186.72   0.45   0.48   0.89 
  4096   1.2229e-02   2.3885e-05   342.97   0.42   0.45   0.84 
  8192   9.7926e-03   3.8252e-05   428.31   0.14   0.13   0.27 
  16384   6.0150e-03   4.6992e-05   697.31   0.13   0.12   0.23 
  32768   4.2849e-03   6.6951e-05   978.86   0.09   0.08   0.16 
  65536   3.3317e-03   1.0412e-04   1258.91   0.06   0.06   0.10 
  131072   3.1116e-03   1.9448e-04   1347.96   0.03   0.04   0.07 
  262144   3.6096e-03   4.5120e-04   1161.98   0.03   0.03   0.05 
  524288   4.7417e-03   1.1854e-03   884.56   0.01   0.01   0.01 
  1048576   4.8175e-03   2.4087e-03   870.64   0.01   0.01   0.01 
  2097152   4.7269e-03   4.7269e-03   887.33   0.00   0.00   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   3   6 
  8192   4   10   0   8   2 
  16384   4   10   0   8   2 
  32768   4   0   10   8   2 
  65536   4   10   0   8   2 
  131072   10   4   0   8   2 
  262144   10   4   8   0   6 
  524288   4   0   2   10   1 
  1048576   0   5   2   10   4 
  2097152   8   4   10   0   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   3 
  8192    1   3   9 
  16384    1   3   11 
  32768    1   3   11 
  65536    1   5   11 
  131072    2   7   11 
  262144    1   11   11 
  524288    7   11   11 
  1048576    11   11   11 
  2097152    11   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.6903e-02   2.6273e-05   155.90   0.35   0.31   0.79 
  4096   1.6910e-02   3.3028e-05   248.03   0.27   0.24   0.63 
  8192   1.2650e-02   4.9415e-05   331.56   0.23   0.23   0.37 
  16384   9.8287e-03   7.6787e-05   426.74   0.15   0.14   0.23 
  32768   8.4823e-03   1.3254e-04   494.47   0.08   0.09   0.13 
  65536   6.8782e-03   2.1494e-04   609.80   0.06   0.06   0.10 
  131072   5.8502e-03   3.6564e-04   716.95   0.04   0.04   0.07 
  262144   5.3972e-03   6.7465e-04   777.12   0.03   0.03   0.05 
  524288   5.1958e-03   1.2989e-03   807.25   0.01   0.01   0.03 
  1048576   4.9240e-03   2.4620e-03   851.80   0.02   0.02   0.05 
  2097152   4.7624e-03   4.7624e-03   880.72   0.02   0.02   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   4   2   1   6 
  4096   0   2   4   1   6 
  8192   4   5   10   0   8 
  16384   4   5   0   10   2 
  32768   4   5   0   10   8 
  65536   4   5   0   10   8 
  131072   4   5   10   0   8 
  262144   4   0   10   5   6 
  524288   5   7   10   6   1 
  1048576   4   0   7   9   5 
  2097152   0   8   7   2   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   7 
  8192    1   1   6 
  16384    1   1   11 
  32768    1   3   11 
  65536    1   4   11 
  131072    1   7   11 
  262144    2   11   11 
  524288    4   11   11 
  1048576    2   10   11 
  2097152    4   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.6842e-02   2.6213e-05   156.26   0.34   0.30   0.79 
  4096   1.6806e-02   3.2824e-05   249.58   0.27   0.23   0.62 
  8192   1.2458e-02   4.8664e-05   336.68   0.23   0.23   0.37 
  16384   9.5593e-03   7.4682e-05   438.77   0.16   0.16   0.24 
  32768   8.2444e-03   1.2882e-04   508.74   0.09   0.08   0.13 
  65536   6.7514e-03   2.1098e-04   621.25   0.06   0.06   0.09 
  131072   5.8195e-03   3.6372e-04   720.74   0.02   0.02   0.05 
  262144   5.3133e-03   6.6416e-04   789.40   0.02   0.02   0.05 
  524288   5.0620e-03   1.2655e-03   828.58   0.02   0.02   0.05 
  1048576   4.8252e-03   2.4126e-03   869.25   0.01   0.01   0.03 
  2097152   4.5543e-03   4.5543e-03   920.96   0.01   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   4   2   1   6 
  4096   0   2   4   1   6 
  8192   4   5   10   0   8 
  16384   4   5   0   10   2 
  32768   4   5   0   10   2 
  65536   4   10   5   2   0 
  131072   2   4   5   10   1 
  262144   5   4   10   8   6 
  524288   10   5   1   4   2 
  1048576   5   4   10   8   1 
  2097152   0   2   4   10   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   7 
  8192    1   1   6 
  16384    1   1   11 
  32768    1   2   11 
  65536    1   3   11 
  131072    3   11   11 
  262144    3   10   11 
  524288    4   11   11 
  1048576    4   11   11 
  2097152    4   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2407e-02   2.1882e-05   187.19   0.39   0.34   0.93 
  4096   1.2207e-02   2.3841e-05   343.60   0.37   0.33   0.87 
  8192   7.8835e-03   3.0795e-05   532.04   0.38   0.37   0.61 
  16384   5.1304e-03   4.0082e-05   817.53   0.30   0.29   0.47 
  32768   3.8197e-03   5.9683e-05   1098.06   0.20   0.19   0.31 
  65536   3.1124e-03   9.7264e-05   1347.60   0.11   0.11   0.19 
  131072   2.9999e-03   1.8749e-04   1398.16   0.07   0.07   0.10 
  262144   3.6187e-03   4.5234e-04   1159.06   0.02   0.03   0.04 
  524288   4.7151e-03   1.1788e-03   889.54   0.01   0.01   0.02 
  1048576   4.8028e-03   2.4014e-03   873.30   0.01   0.01   0.02 
  2097152   4.7255e-03   4.7255e-03   887.60   0.01   0.01   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   4   2   1   5 
  4096   0   2   4   1   3 
  8192   4   5   10   0   2 
  16384   4   5   10   0   8 
  32768   4   5   0   10   8 
  65536   4   5   10   0   2 
  131072   4   0   5   10   8 
  262144   4   0   10   5   8 
  524288   4   0   5   10   2 
  1048576   4   10   5   6   0 
  2097152   5   0   8   2   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   1   2 
  16384    1   1   4 
  32768    1   1   6 
  65536    1   2   11 
  131072    1   4   11 
  262144    4   11   11 
  524288    5   11   11 
  1048576    7   11   11 
  2097152    9   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:24 EDT.
80753 accesses since 1/2/96.