COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 2MB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 16, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1099.55 -1.08 83.6%
1 iter.1217.61 -0.74 83.1%
10 iter.1951.32 0.01 85.1%
cache inv. w/overlap1093.70 -1.87 88.6%
1 iter. w/overlap1229.28 -2.32 93.7%
10 iter. w/overlap1977.61 -0.75 90.9%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1104.03 -2.86 94.1%
1 iter.1274.09 -2.87 97.6%
10 iter.1930.80 -2.21 100.7%
cache inv. w/overlap1119.99 -2.95 95.2%
1 iter. w/overlap1253.54 -3.10 98.8%
10 iter. w/overlap1953.48 -3.52 111.9%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1122.99 -5.48 111.0%
1 iter.1218.66 -4.04 104.3%
10 iter.1766.10 -3.09 105.5%
cache inv. w/overlap1109.25 -5.17 108.4%
1 iter. w/overlap1265.27 -4.94 110.1%
10 iter. w/overlap1877.34 -1.56 95.8%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1113.58 19.72 4.7%
1 iter.1250.61 17.97 4.4%
10 iter.1908.99 18.18 28.9%
cache inv. w/overlap1107.26 12.37 3.6%
1 iter. w/overlap1255.44 11.37 3.0%
10 iter. w/overlap2058.06 10.57 34.6%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1115.98 20.78 4.6%
1 iter.1234.50 22.53 5.7%
10 iter.1952.65 20.43 31.3%
cache inv. w/overlap1100.58 14.61 4.2%
1 iter. w/overlap1258.43 13.60 1.3%
10 iter. w/overlap2060.37 13.06 34.3%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1104.62 -2.13 88.7%
1 iter.1264.49 -2.47 94.4%
10 iter.1937.96 -4.40 121.2%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1127.81 26.79 6.2%
1 iter.1257.39 26.76 9.7%
10 iter.1934.54 23.26 30.4%
cache inv. w/overlap1106.79 28.93 8.7%
1 iter. w/overlap1266.03 28.26 8.7%
10 iter. w/overlap1989.11 24.41 33.6%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1102.58 24.45 5.7%
1 iter.1231.47 24.48 7.1%
10 iter.1934.80 23.16 30.3%
cache inv. w/overlap1090.89 25.54 5.7%
1 iter. w/overlap1250.16 25.57 6.5%
10 iter. w/overlap1896.76 24.12 27.5%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1106.08 26.61 34.5%
1 iter.1240.55 27.89 30.0%
10 iter.1766.84 25.31 34.6%
cache inv. w/overlap1099.44 27.64 31.5%
1 iter. w/overlap1266.84 28.25 33.5%
10 iter. w/overlap1886.36 25.61 28.1%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.4340e-02   1.4004e-05   292.49   0.58   0.63   1.33 
  4096   1.3236e-02   2.5852e-05   316.88   0.25   0.23   0.50 
  8192   8.6401e-03   3.3751e-05   485.44   0.20   0.13   0.55 
  16384   6.2110e-03   4.8523e-05   675.31   0.19   0.06   0.67 
  32768   4.9816e-03   7.7837e-05   841.96   0.18   0.04   0.69 
  65536   4.3391e-03   1.3560e-04   966.64   0.12   0.02   0.52 
  131072   4.1450e-03   2.5906e-04   1011.89   0.09   0.06   0.29 
  262144   3.9355e-03   4.9194e-04   1065.76   0.03   0.01   0.15 
  524288   3.8652e-03   9.6630e-04   1085.14   0.02   0.02   0.06 
  1048576   3.7994e-03   1.8997e-03   1103.93   0.02   0.01   0.08 
  2097152   3.8533e-03   3.8533e-03   1088.48   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   4 
  4096   4   5   6   8   2 
  8192   4   5   6   8   2 
  16384   4   6   5   2   8 
  32768   4   6   2   8   1 
  65536   8   5   6   4   1 
  131072   5   4   7   1   8 
  262144   6   3   7   4   2 
  524288   1   4   2   7   6 
  1048576   7   8   5   4   1 
  2097152   1   6   8   4   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   4 
  4096    1   1   5 
  8192    1   1   7 
  16384    1   1   7 
  32768    1   6   7 
  65536    1   7   7 
  131072    4   4   7 
  262144    4   8   9 
  524288    3   8   9 
  1048576    3   8   9 
  2097152    4   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.4063e-02   1.3733e-05   298.25   0.58   0.59   1.35 
  4096   1.3135e-02   2.5654e-05   319.32   0.22   0.22   0.43 
  8192   8.2685e-03   3.2299e-05   507.26   0.20   0.11   0.58 
  16384   5.7660e-03   4.5047e-05   727.42   0.19   0.09   0.66 
  32768   4.5151e-03   7.0548e-05   928.96   0.19   0.06   0.78 
  65536   3.9106e-03   1.2221e-04   1072.55   0.10   0.02   0.45 
  131072   3.6680e-03   2.2925e-04   1143.50   0.10   0.08   0.28 
  262144   3.4530e-03   4.3163e-04   1214.68   0.05   0.03   0.18 
  524288   3.3976e-03   8.4939e-04   1234.50   0.03   0.01   0.11 
  1048576   3.3170e-03   1.6585e-03   1264.49   0.04   0.03   0.11 
  2097152   3.2409e-03   3.2409e-03   1294.19   0.04   0.04   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   4 
  4096   4   5   6   8   2 
  8192   4   5   6   8   2 
  16384   4   6   8   5   7 
  32768   4   6   8   5   7 
  65536   5   4   6   7   1 
  131072   4   1   5   7   2 
  262144   8   5   1   6   7 
  524288   5   2   7   6   1 
  1048576   6   7   2   4   5 
  2097152   8   5   4   6   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   4 
  4096    1   1   7 
  8192    1   1   7 
  16384    1   1   7 
  32768    1   4   7 
  65536    3   7   7 
  131072    3   4   7 
  262144    2   5   9 
  524288    3   7   9 
  1048576    3   7   9 
  2097152    2   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.1039e-02   1.0781e-05   379.94   0.77   0.85   1.62 
  4096   1.1108e-02   2.1696e-05   377.58   0.25   0.22   0.44 
  8192   6.3825e-03   2.4932e-05   657.16   0.21   0.18   0.41 
  16384   4.0337e-03   3.1514e-05   1039.81   0.20   0.12   0.56 
  32768   2.8995e-03   4.5305e-05   1446.54   0.20   0.08   0.66 
  65536   2.3538e-03   7.3557e-05   1781.91   0.11   0.02   0.44 
  131072   2.1810e-03   1.3631e-04   1923.11   0.07   0.03   0.22 
  262144   2.1480e-03   2.6850e-04   1952.65   0.03   0.01   0.11 
  524288   2.4076e-03   6.0190e-04   1742.11   0.02   0.02   0.03 
  1048576   2.9891e-03   1.4946e-03   1403.18   0.01   0.01   0.03 
  2097152   3.0480e-03   3.0480e-03   1376.09   0.07   0.04   0.23 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   3   1   4 
  4096   4   5   6   2   8 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   2   6   8 
  65536   4   6   1   7   2 
  131072   1   5   7   4   8 
  262144   5   1   6   8   7 
  524288   8   6   3   2   9 
  1048576   5   4   1   6   2 
  2097152   6   7   2   1   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   2 
  4096    1   1   5 
  8192    1   1   6 
  16384    1   1   7 
  32768    1   2   7 
  65536    2   7   7 
  131072    4   6   9 
  262144    5   7   9 
  524288    3   9   9 
  1048576    5   9   9 
  2097152    2   6   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.4543e-02   1.4202e-05   288.41   0.50   0.24   1.39 
  4096   9.8439e-03   1.9226e-05   426.08   0.66   0.70   1.10 
  8192   6.7160e-03   2.6234e-05   624.52   0.51   0.46   1.05 
  16384   5.2420e-03   4.0953e-05   800.14   0.39   0.29   0.98 
  32768   4.4491e-03   6.9517e-05   942.74   0.30   0.18   0.89 
  65536   4.0842e-03   1.2763e-04   1026.95   0.20   0.11   0.53 
  131072   4.0165e-03   2.5103e-04   1044.27   0.10   0.07   0.32 
  262144   3.9120e-03   4.8900e-04   1072.17   0.04   0.02   0.16 
  524288   3.8220e-03   9.5549e-04   1097.42   0.02   0.02   0.06 
  1048576   3.7450e-03   1.8725e-03   1119.99   0.03   0.03   0.05 
  2097152   3.8490e-03   3.8490e-03   1089.70   0.02   0.02   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   3 
  4096   4   5   6   2   8 
  8192   4   5   6   2   8 
  16384   4   5   2   6   8 
  32768   4   5   6   2   8 
  65536   4   5   7   8   2 
  131072   4   5   7   1   2 
  262144   4   5   8   2   1 
  524288   4   5   2   9   7 
  1048576   2   4   9   1   6 
  2097152   8   3   4   5   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   5 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   7 
  65536    2   2   6 
  131072    2   4   7 
  262144    1   8   9 
  524288    1   8   9 
  1048576    1   8   9 
  2097152    2   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.4027e-02   1.3698e-05   299.02   0.51   0.23   1.42 
  4096   9.2580e-03   1.8082e-05   453.04   0.71   0.76   1.14 
  8192   6.3200e-03   2.4687e-05   663.66   0.51   0.49   1.04 
  16384   4.7630e-03   3.7211e-05   880.60   0.41   0.36   0.99 
  32768   4.0649e-03   6.3514e-05   1031.83   0.31   0.19   0.89 
  65536   3.5980e-03   1.1244e-04   1165.74   0.19   0.12   0.57 
  131072   3.5430e-03   2.2144e-04   1183.82   0.11   0.06   0.31 
  262144   3.4180e-03   4.2725e-04   1227.13   0.06   0.04   0.16 
  524288   3.4080e-03   8.5199e-04   1230.74   0.03   0.02   0.10 
  1048576   3.3273e-03   1.6636e-03   1260.58   0.03   0.02   0.07 
  2097152   3.2731e-03   3.2731e-03   1281.44   0.04   0.02   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   3 
  4096   4   5   6   2   8 
  8192   4   5   6   8   2 
  16384   4   5   6   8   2 
  32768   4   5   6   2   8 
  65536   4   5   6   8   1 
  131072   4   5   7   1   2 
  262144   5   6   4   8   1 
  524288   8   5   4   6   1 
  1048576   6   2   4   7   5 
  2097152   3   8   7   2   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   6 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   7 
  65536    1   2   7 
  131072    1   3   7 
  262144    1   6   9 
  524288    3   7   9 
  1048576    2   8   9 
  2097152    1   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.1182e-02   1.0920e-05   375.09   0.63   0.34   1.59 
  4096   7.2275e-03   1.4116e-05   580.33   0.84   0.94   1.20 
  8192   4.4619e-03   1.7429e-05   940.03   0.67   0.77   0.97 
  16384   3.0797e-03   2.4060e-05   1361.94   0.45   0.52   0.64 
  32768   2.3712e-03   3.7050e-05   1768.86   0.29   0.33   0.42 
  65536   2.0380e-03   6.3687e-05   2058.06   0.15   0.20   0.20 
  131072   2.0357e-03   1.2723e-04   2060.37   0.09   0.13   0.15 
  262144   2.0573e-03   2.5717e-04   2038.70   0.05   0.04   0.09 
  524288   2.3558e-03   5.8895e-04   1780.41   0.03   0.03   0.05 
  1048576   2.9369e-03   1.4684e-03   1428.14   0.02   0.02   0.04 
  2097152   3.1207e-03   3.1207e-03   1344.01   0.01   0.00   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   5 
  4096   4   5   8   6   2 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   6   8   2 
  65536   4   5   6   1   3 
  131072   5   4   1   7   6 
  262144   5   4   7   1   2 
  524288   4   5   8   6   3 
  1048576   4   5   9   1   6 
  2097152   1   2   4   8   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   9 
  131072    2   2   9 
  262144    2   5   9 
  524288    2   9   9 
  1048576    3   9   9 
  2097152    7   9   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:22:11 EDT.
81068 accesses since 1/2/96.