COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 2MB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1275.30 11.44 27.3%
1 iter.1294.96 11.60 27.9%
10 iter.2152.69 11.81 37.4%
cache inv. w/overlap1263.24 11.68 27.4%
1 iter. w/overlap1292.72 11.45 28.6%
10 iter. w/overlap2113.24 12.58 35.8%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1266.99 10.31 31.0%
1 iter.1311.97 10.29 31.4%
10 iter.2125.69 9.69 37.9%
cache inv. w/overlap1255.73 10.10 31.1%
1 iter. w/overlap1286.14 10.51 30.4%
10 iter. w/overlap2088.38 9.68 37.1%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1241.86 12.31 43.4%
1 iter.1289.37 12.22 43.7%
10 iter.1901.32 11.61 39.2%
cache inv. w/overlap1283.48 12.72 41.8%
1 iter. w/overlap1314.92 12.34 42.4%
10 iter. w/overlap2000.18 11.60 35.0%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1235.53 17.37 2.0%
1 iter.1316.99 17.64 3.4%
10 iter.2103.58 17.24 35.9%
cache inv. w/overlap1270.47 10.31 2.5%
1 iter. w/overlap1298.06 10.36 4.0%
10 iter. w/overlap2253.18 9.79 39.0%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1255.75 20.21 1.7%
1 iter.1280.47 20.13 2.2%
10 iter.2106.84 19.15 35.4%
cache inv. w/overlap1252.91 12.40 3.4%
1 iter. w/overlap1309.09 12.35 5.4%
10 iter. w/overlap2237.60 11.73 38.9%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1249.99 9.28 31.1%
1 iter.1299.52 9.34 31.5%
10 iter.2113.69 8.57 35.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1242.45 21.11 3.1%
1 iter.1322.11 20.99 3.0%
10 iter.2155.91 19.18 37.3%
cache inv. w/overlap1268.29 20.62 4.5%
1 iter. w/overlap1298.37 20.32 6.5%
10 iter. w/overlap2119.56 20.63 36.3%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1257.67 20.86 7.5%
1 iter.1289.85 19.66 9.4%
10 iter.2132.03 20.75 36.1%
cache inv. w/overlap1266.90 20.45 15.4%
1 iter. w/overlap1286.50 19.87 4.9%
10 iter. w/overlap2082.18 20.09 36.2%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1253.22 23.34 31.7%
1 iter.1323.71 23.16 32.3%
10 iter.1870.57 22.80 38.2%
cache inv. w/overlap1256.32 23.18 30.9%
1 iter. w/overlap1319.09 23.21 31.9%
10 iter. w/overlap2029.64 24.40 33.0%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2943e-02   1.2640e-05   324.06   0.56   0.66   1.20 
  4096   8.1938e-03   1.6003e-05   511.89   0.45   0.53   1.02 
  8192   7.9327e-03   3.0987e-05   528.74   0.15   0.08   0.45 
  16384   5.5810e-03   4.3602e-05   751.53   0.16   0.07   0.54 
  32768   4.4499e-03   6.9529e-05   942.57   0.15   0.03   0.59 
  65536   3.8789e-03   1.2121e-04   1081.33   0.10   0.01   0.45 
  131072   3.6005e-03   2.2503e-04   1164.92   0.10   0.10   0.27 
  262144   3.4889e-03   4.3611e-04   1202.20   0.03   0.01   0.12 
  524288   3.3774e-03   8.4436e-04   1241.86   0.02   0.02   0.07 
  1048576   3.3130e-03   1.6565e-03   1266.00   0.02   0.02   0.03 
  2097152   3.2060e-03   3.2060e-03   1308.27   0.03   0.02   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   6   5   1   8 
  16384   4   6   5   2   7 
  32768   4   8   6   2   5 
  65536   2   6   8   7   1 
  131072   5   7   4   1   8 
  262144   6   8   5   2   1 
  524288   2   1   8   6   7 
  1048576   1   8   2   9   7 
  2097152   6   7   9   2   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   2   7 
  16384    1   3   7 
  32768    3   7   7 
  65536    2   7   7 
  131072    2   4   8 
  262144    6   7   9 
  524288    4   7   9 
  1048576    2   9   9 
  2097152    1   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2857e-02   1.2555e-05   326.24   0.56   0.67   1.20 
  4096   8.0740e-03   1.5770e-05   519.48   0.46   0.54   1.03 
  8192   7.7597e-03   3.0311e-05   540.52   0.16   0.10   0.46 
  16384   5.5385e-03   4.3270e-05   757.30   0.15   0.05   0.51 
  32768   4.2854e-03   6.6959e-05   978.75   0.17   0.06   0.61 
  65536   3.7655e-03   1.1767e-04   1113.88   0.10   0.02   0.40 
  131072   3.5098e-03   2.1936e-04   1195.04   0.10   0.12   0.25 
  262144   3.3712e-03   4.2140e-04   1244.15   0.03   0.00   0.17 
  524288   3.2709e-03   8.1772e-04   1282.32   0.02   0.02   0.03 
  1048576   3.2066e-03   1.6033e-03   1308.01   0.02   0.02   0.03 
  2097152   3.0833e-03   3.0833e-03   1360.33   0.01   0.01   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   6   5   8   2 
  16384   4   6   2   5   7 
  32768   4   6   8   7   5 
  65536   1   6   4   7   2 
  131072   1   7   5   4   8 
  262144   7   5   1   2   8 
  524288   6   2   7   8   3 
  1048576   2   9   6   4   1 
  2097152   3   8   5   6   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   2   4 
  8192    1   1   7 
  16384    1   3   7 
  32768    1   4   7 
  65536    3   7   7 
  131072    4   4   8 
  262144    6   7   9 
  524288    3   9   9 
  1048576    3   9   9 
  2097152    5   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.0305e-02   1.0063e-05   407.03   0.73   0.87   1.52 
  4096   5.9180e-03   1.1559e-05   708.74   0.65   0.76   1.41 
  8192   6.0090e-03   2.3472e-05   698.01   0.16   0.15   0.35 
  16384   3.7266e-03   2.9114e-05   1125.50   0.18   0.11   0.50 
  32768   2.6173e-03   4.0896e-05   1602.51   0.19   0.07   0.62 
  65536   2.1061e-03   6.5814e-05   1991.54   0.11   0.04   0.42 
  131072   1.9484e-03   1.2178e-04   2152.69   0.09   0.08   0.25 
  262144   1.9455e-03   2.4319e-04   2155.91   0.04   0.02   0.15 
  524288   2.3023e-03   5.7557e-04   1821.81   0.01   0.01   0.02 
  1048576   2.9296e-03   1.4648e-03   1431.71   0.01   0.01   0.04 
  2097152   3.0845e-03   3.0845e-03   1359.80   0.05   0.02   0.20 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   3   1   4 
  4096   6   2   3   1   4 
  8192   4   5   6   2   8 
  16384   4   6   5   2   8 
  32768   4   5   6   2   8 
  65536   6   4   2   1   8 
  131072   1   7   5   4   2 
  262144   7   1   8   2   6 
  524288   7   5   8   4   1 
  1048576   7   6   1   4   2 
  2097152   2   7   5   1   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   2 
  4096    1   1   2 
  8192    1   1   7 
  16384    1   1   7 
  32768    1   3   7 
  65536    1   7   7 
  131072    2   4   8 
  262144    2   7   9 
  524288    6   9   9 
  1048576    3   9   9 
  2097152    4   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2735e-02   1.2436e-05   329.35   0.44   0.25   1.21 
  4096   8.0288e-03   1.5681e-05   522.41   0.36   0.18   1.03 
  8192   5.9824e-03   2.3369e-05   701.10   0.44   0.44   0.86 
  16384   4.5402e-03   3.5470e-05   923.81   0.36   0.31   0.85 
  32768   3.8891e-03   6.0768e-05   1078.46   0.28   0.18   0.79 
  65536   3.5703e-03   1.1157e-04   1174.78   0.14   0.09   0.44 
  131072   3.4984e-03   2.1865e-04   1198.92   0.11   0.07   0.24 
  262144   3.4389e-03   4.2986e-04   1219.67   0.02   0.01   0.06 
  524288   3.3628e-03   8.4069e-04   1247.28   0.01   0.01   0.05 
  1048576   3.3275e-03   1.6638e-03   1260.48   0.01   0.01   0.02 
  2097152   3.2301e-03   3.2301e-03   1298.49   0.02   0.02   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   5 
  4096   6   2   4   1   3 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   2   6   1 
  65536   4   5   6   2   7 
  131072   4   5   1   7   2 
  262144   5   8   4   7   2 
  524288   8   7   3   9   5 
  1048576   3   1   7   9   6 
  2097152   2   7   4   3   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   6 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   7 
  65536    1   2   7 
  131072    1   4   9 
  262144    3   7   9 
  524288    5   9   9 
  1048576    7   9   9 
  2097152    2   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.2785e-02   1.2485e-05   328.07   0.43   0.24   1.19 
  4096   8.1105e-03   1.5841e-05   517.15   0.34   0.17   0.99 
  8192   5.8831e-03   2.2981e-05   712.94   0.45   0.46   0.85 
  16384   4.4909e-03   3.5085e-05   933.95   0.37   0.31   0.86 
  32768   3.8374e-03   5.9959e-05   1093.01   0.27   0.16   0.78 
  65536   3.4248e-03   1.0702e-04   1224.69   0.17   0.12   0.48 
  131072   3.4055e-03   2.1284e-04   1231.63   0.11   0.09   0.24 
  262144   3.2915e-03   4.1144e-04   1274.27   0.04   0.03   0.10 
  524288   3.2446e-03   8.1114e-04   1292.72   0.02   0.02   0.09 
  1048576   3.2176e-03   1.6088e-03   1303.53   0.01   0.01   0.03 
  2097152   3.0499e-03   3.0499e-03   1375.25   0.03   0.02   0.07 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   4   2   1   3 
  4096   6   2   4   1   3 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   8   6   2 
  65536   4   5   7   1   6 
  131072   5   4   1   7   8 
  262144   4   5   8   7   6 
  524288   1   5   4   8   2 
  1048576   9   6   3   7   8 
  2097152   8   6   9   3   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   3   6 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   7 
  65536    1   2   7 
  131072    2   4   9 
  262144    1   7   9 
  524288    2   8   9 
  1048576    4   9   9 
  2097152    1   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.0303e-02   1.0062e-05   407.09   0.57   0.31   1.55 
  4096   5.9578e-03   1.1636e-05   704.00   0.49   0.26   1.32 
  8192   4.0368e-03   1.5769e-05   1039.02   0.62   0.72   0.94 
  16384   2.7936e-03   2.1825e-05   1501.37   0.43   0.51   0.65 
  32768   2.1428e-03   3.3481e-05   1957.39   0.29   0.34   0.42 
  65536   1.8797e-03   5.8740e-05   2231.41   0.13   0.16   0.19 
  131072   1.8615e-03   1.1634e-04   2253.18   0.10   0.13   0.16 
  262144   1.9316e-03   2.4144e-04   2171.47   0.04   0.03   0.10 
  524288   2.2626e-03   5.6564e-04   1853.77   0.02   0.02   0.04 
  1048576   2.8965e-03   1.4483e-03   1448.05   0.01   0.01   0.03 
  2097152   3.0719e-03   3.0719e-03   1365.38   0.02   0.02   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   3   5 
  4096   6   2   4   1   5 
  8192   4   5   6   8   2 
  16384   4   5   6   8   2 
  32768   4   5   6   2   8 
  65536   4   5   6   7   1 
  131072   4   5   7   1   3 
  262144   4   5   7   6   1 
  524288   5   4   6   7   2 
  1048576   4   5   9   8   3 
  2097152   7   5   6   9   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   9 
  131072    2   2   9 
  262144    2   7   9 
  524288    2   9   9 
  1048576    2   9   9 
  2097152    2   8   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:19 EDT.
81503 accesses since 1/2/96.