COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 2MB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1001.06 19.75 16.6%
1 iter.1019.61 19.68 16.6%
10 iter.1774.06 19.49 40.4%
cache inv. w/overlap 999.00 19.34 18.2%
1 iter. w/overlap1014.02 19.63 18.3%
10 iter. w/overlap1769.76 19.64 39.3%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 866.30 19.44 12.0%
1 iter. 922.05 19.27 7.5%
10 iter.1824.73 18.68 41.8%
cache inv. w/overlap 898.41 19.77 8.4%
1 iter. w/overlap1019.33 19.65 14.2%
10 iter. w/overlap1830.87 18.84 43.3%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 840.72 21.21 29.1%
1 iter. 943.34 20.91 32.9%
10 iter.1526.81 20.63 40.6%
cache inv. w/overlap 864.84 21.05 25.3%
1 iter. w/overlap 989.68 21.23 26.4%
10 iter. w/overlap1742.67 20.93 39.3%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 984.36 35.74 5.8%
1 iter.1028.37 36.06 4.3%
10 iter.1670.31 34.78 36.8%
cache inv. w/overlap 998.75 19.08 3.0%
1 iter. w/overlap1032.73 19.35 4.8%
10 iter. w/overlap2011.75 18.83 46.3%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1001.66 37.22 3.3%
1 iter.1020.22 37.55 3.3%
10 iter.1649.02 36.79 37.7%
cache inv. w/overlap1006.62 21.19 3.2%
1 iter. w/overlap1020.96 21.91 5.7%
10 iter. w/overlap1918.60 20.83 43.6%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 990.42 17.29 14.4%
1 iter. 948.95 17.14 9.2%
10 iter.1878.30 16.79 43.5%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 998.19 30.87 8.4%
1 iter.1015.77 31.17 8.0%
10 iter.1752.10 29.36 38.4%
cache inv. w/overlap1002.10 30.75 8.9%
1 iter. w/overlap1015.99 31.09 10.2%
10 iter. w/overlap1770.32 29.01 39.3%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 866.96 25.47 14.0%
1 iter. 930.62 25.59 11.1%
10 iter.1821.86 27.08 42.3%
cache inv. w/overlap 883.11 25.40 13.5%
1 iter. w/overlap 945.58 26.06 9.9%
10 iter. w/overlap1859.87 27.14 43.4%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 855.54 31.24 21.9%
1 iter. 982.24 30.74 25.0%
10 iter.1535.12 27.31 40.6%
cache inv. w/overlap 872.58 31.07 18.2%
1 iter. w/overlap 950.22 31.05 20.4%
10 iter. w/overlap1745.69 28.22 38.9%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1689e-02   2.1181e-05   193.38   0.42   0.36   0.94 
  4096   1.2836e-02   2.5070e-05   326.76   0.34   0.28   0.80 
  8192   9.6983e-03   3.7884e-05   432.48   0.22   0.15   0.44 
  16384   6.9758e-03   5.4499e-05   601.26   0.20   0.10   0.55 
  32768   5.6732e-03   8.8644e-05   739.32   0.17   0.06   0.58 
  65536   4.8802e-03   1.5251e-04   859.45   0.16   0.08   0.43 
  131072   4.5965e-03   2.8728e-04   912.49   0.12   0.11   0.32 
  262144   4.4554e-03   5.5693e-04   941.39   0.09   0.08   0.23 
  524288   4.2349e-03   1.0587e-03   990.42   0.11   0.05   0.25 
  1048576   4.2415e-03   2.1207e-03   988.87   0.09   0.15   0.18 
  2097152   4.1613e-03   4.1613e-03   1007.92   0.09   0.05   0.19 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   8 
  4096   6   2   1   3   8 
  8192   6   8   2   1   7 
  16384   6   8   2   7   1 
  32768   8   2   6   7   1 
  65536   2   6   1   7   4 
  131072   1   7   4   5   6 
  262144   1   5   4   7   6 
  524288   6   7   5   4   1 
  1048576   1   5   4   7   6 
  2097152   6   4   7   5   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   3   5 
  16384    1   3   7 
  32768    2   4   7 
  65536    1   4   6 
  131072    1   4   7 
  262144    2   4   9 
  524288    1   5   9 
  1048576    2   4   9 
  2097152    2   5   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1464e-02   2.0961e-05   195.41   0.43   0.38   0.96 
  4096   1.2690e-02   2.4785e-05   330.53   0.35   0.29   0.80 
  8192   9.6998e-03   3.7890e-05   432.41   0.19   0.16   0.38 
  16384   6.8051e-03   5.3165e-05   616.35   0.21   0.12   0.56 
  32768   5.5199e-03   8.6249e-05   759.85   0.17   0.08   0.56 
  65536   4.8229e-03   1.5072e-04   869.67   0.11   0.03   0.41 
  131072   4.4899e-03   2.8062e-04   934.15   0.11   0.07   0.29 
  262144   4.3241e-03   5.4052e-04   969.98   0.07   0.04   0.25 
  524288   4.2402e-03   1.0601e-03   989.17   0.08   0.04   0.21 
  1048576   4.0786e-03   2.0393e-03   1028.37   0.09   0.09   0.19 
  2097152   4.0558e-03   4.0558e-03   1034.15   0.09   0.09   0.18 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   8 
  4096   6   2   1   3   8 
  8192   6   8   2   1   7 
  16384   6   8   2   1   7 
  32768   6   8   2   7   1 
  65536   8   6   2   1   7 
  131072   7   1   5   4   8 
  262144   1   4   7   5   8 
  524288   7   4   1   5   6 
  1048576   4   5   1   7   3 
  2097152   7   4   6   5   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   3   5 
  16384    1   2   6 
  32768    1   3   7 
  65536    2   5   7 
  131072    1   3   7 
  262144    1   5   8 
  524288    2   5   9 
  1048576    2   4   9 
  2097152    1   4   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.8502e-02   1.8068e-05   226.70   0.49   0.50   1.11 
  4096   9.9079e-03   1.9351e-05   423.33   0.46   0.40   1.04 
  8192   6.7817e-03   2.6491e-05   618.47   0.27   0.28   0.59 
  16384   4.0409e-03   3.1570e-05   1037.96   0.20   0.20   0.49 
  32768   2.7101e-03   4.2345e-05   1547.68   0.23   0.14   0.57 
  65536   2.2330e-03   6.9782e-05   1878.30   0.16   0.09   0.39 
  131072   2.3642e-03   1.4777e-04   1774.06   0.06   0.02   0.16 
  262144   2.7741e-03   3.4676e-04   1511.98   0.04   0.02   0.10 
  524288   3.7052e-03   9.2630e-04   1132.01   0.02   0.01   0.08 
  1048576   3.8577e-03   1.9288e-03   1087.26   0.06   0.03   0.19 
  2097152   3.9101e-03   3.9101e-03   1072.68   0.05   0.01   0.19 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   8 
  4096   6   2   1   3   8 
  8192   6   2   8   1   7 
  16384   6   2   8   1   3 
  32768   6   8   2   1   7 
  65536   6   2   8   1   7 
  131072   1   2   6   7   8 
  262144   6   1   2   8   7 
  524288   7   1   6   4   8 
  1048576   7   4   5   1   6 
  2097152   7   5   8   4   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   1   3 
  16384    1   1   7 
  32768    1   2   5 
  65536    1   3   7 
  131072    3   5   9 
  262144    1   6   9 
  524288    6   7   9 
  1048576    4   7   9 
  2097152    5   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1460e-02   2.0958e-05   195.44   0.26   0.19   0.62 
  4096   1.2717e-02   2.4838e-05   329.82   0.21   0.17   0.48 
  8192   8.8214e-03   3.4459e-05   475.47   0.19   0.17   0.38 
  16384   6.5033e-03   5.0807e-05   644.95   0.18   0.11   0.53 
  32768   5.3792e-03   8.4050e-05   779.72   0.17   0.08   0.54 
  65536   4.7501e-03   1.4844e-04   883.00   0.13   0.07   0.38 
  131072   4.4663e-03   2.7914e-04   939.11   0.11   0.09   0.30 
  262144   4.3744e-03   5.4680e-04   958.82   0.08   0.07   0.23 
  524288   4.2550e-03   1.0638e-03   985.73   0.11   0.15   0.21 
  1048576   4.1542e-03   2.0771e-03   1009.65   0.09   0.04   0.18 
  2097152   4.1556e-03   4.1556e-03   1009.31   0.08   0.04   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   4   2   1   3 
  4096   6   4   2   1   3 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   6   8   2 
  65536   4   8   2   5   7 
  131072   4   5   7   1   8 
  262144   5   4   1   7   2 
  524288   5   4   7   1   9 
  1048576   6   7   1   5   4 
  2097152   4   7   3   1   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   5 
  16384    1   2   7 
  32768    1   3   7 
  65536    1   3   7 
  131072    1   3   7 
  262144    2   4   9 
  524288    2   4   9 
  1048576    1   5   9 
  2097152    1   5   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1294e-02   2.0795e-05   196.97   0.27   0.20   0.63 
  4096   1.2426e-02   2.4269e-05   337.55   0.22   0.17   0.52 
  8192   8.6459e-03   3.3773e-05   485.12   0.20   0.18   0.37 
  16384   6.4279e-03   5.0218e-05   652.52   0.18   0.10   0.53 
  32768   5.2836e-03   8.2556e-05   793.84   0.14   0.07   0.52 
  65536   4.6301e-03   1.4469e-04   905.87   0.14   0.08   0.39 
  131072   4.4385e-03   2.7740e-04   944.99   0.10   0.08   0.28 
  262144   4.2646e-03   5.3308e-04   983.51   0.08   0.04   0.22 
  524288   4.2131e-03   1.0533e-03   995.53   0.08   0.05   0.19 
  1048576   4.1118e-03   2.0559e-03   1020.06   0.04   0.01   0.16 
  2097152   4.0700e-03   4.0700e-03   1030.53   0.10   0.13   0.17 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   4   2   1   3 
  4096   6   2   4   1   5 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   2   6   8 
  65536   4   8   5   2   1 
  131072   4   5   7   1   2 
  262144   5   1   4   7   8 
  524288   4   5   1   7   9 
  1048576   5   2   1   6   4 
  2097152   5   4   7   1   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   5 
  16384    1   2   7 
  32768    2   2   7 
  65536    1   3   7 
  131072    2   4   7 
  262144    1   5   9 
  524288    1   5   9 
  1048576    3   7   9 
  2097152    1   3   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.8609e-02   1.8173e-05   225.39   0.29   0.22   0.68 
  4096   9.9802e-03   1.9493e-05   420.26   0.27   0.20   0.64 
  8192   6.0871e-03   2.3778e-05   689.05   0.26   0.20   0.44 
  16384   3.6447e-03   2.8474e-05   1150.80   0.21   0.18   0.33 
  32768   2.4967e-03   3.9011e-05   1679.95   0.15   0.14   0.24 
  65536   2.0849e-03   6.5153e-05   2011.75   0.10   0.10   0.16 
  131072   2.2305e-03   1.3941e-04   1880.44   0.06   0.06   0.11 
  262144   2.7329e-03   3.4161e-04   1534.74   0.02   0.02   0.04 
  524288   3.6421e-03   9.1053e-04   1151.61   0.02   0.02   0.04 
  1048576   3.8346e-03   1.9173e-03   1093.81   0.03   0.02   0.07 
  2097152   3.8905e-03   3.8905e-03   1078.08   0.02   0.02   0.08 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   4   2   1   5 
  4096   6   4   2   1   5 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   6   2   8 
  65536   4   5   6   8   2 
  131072   4   5   6   2   7 
  262144   4   5   6   2   8 
  524288   4   5   1   7   6 
  1048576   4   5   7   1   9 
  2097152   5   4   7   6   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   5 
  16384    1   1   5 
  32768    1   1   9 
  65536    1   2   9 
  131072    2   3   9 
  262144    2   9   9 
  524288    2   9   9 
  1048576    2   7   9 
  2097152    2   8   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:30 EDT.
80695 accesses since 1/2/96.