COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 2MB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 16, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 985.33 0.17 82.8%
1 iter.1101.01 -0.34 87.3%
10 iter.1606.83 -0.94 96.8%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 969.25 0.30 83.1%
1 iter.1107.96 1.40 80.1%
10 iter.1603.96 0.59 86.2%
cache inv. w/overlap 962.90 1.53 79.0%
1 iter. w/overlap1110.20 1.46 80.8%
10 iter. w/overlap1587.96 0.25 88.0%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 968.82 0.39 82.8%
1 iter.1118.45 0.34 84.6%
10 iter.1615.97 -0.01 88.9%
cache inv. w/overlap 970.68 0.63 82.3%
1 iter. w/overlap1119.67 -0.28 88.3%
10 iter. w/overlap1610.16 0.02 88.9%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 962.53 2.29 76.7%
1 iter.1120.59 1.68 80.4%
10 iter.1583.97 1.29 83.7%
cache inv. w/overlap 958.47 2.40 76.0%
1 iter. w/overlap1124.50 2.21 78.9%
10 iter. w/overlap1593.83 1.16 84.7%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 970.91 13.31 29.7%
1 iter.1126.58 12.15 30.4%
10 iter.1716.51 11.84 36.1%
cache inv. w/overlap 978.84 10.90 31.9%
1 iter. w/overlap1128.04 11.33 32.2%
10 iter. w/overlap1714.69 9.99 36.4%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 976.77 13.10 31.4%
1 iter.1127.76 13.64 30.9%
10 iter.1685.81 13.21 36.0%
cache inv. w/overlap 966.87 12.29 30.6%
1 iter. w/overlap1129.04 11.70 31.0%
10 iter. w/overlap1728.32 10.91 36.8%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 972.72 0.51 83.0%
1 iter.1119.99 1.47 80.4%
10 iter.1599.08 0.78 86.3%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 959.05 19.88 26.6%
1 iter.1126.30 19.89 26.4%
10 iter.1590.48 19.98 31.5%
cache inv. w/overlap 981.13 20.64 27.1%
1 iter. w/overlap1122.99 21.50 25.2%
10 iter. w/overlap1580.53 20.31 30.5%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 973.02 18.90 27.9%
1 iter.1109.32 20.74 23.8%
10 iter.1615.05 19.32 33.3%
cache inv. w/overlap 967.11 19.84 27.8%
1 iter. w/overlap1107.59 20.21 27.2%
10 iter. w/overlap1606.11 20.03 31.6%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 960.87 20.56 26.5%
1 iter.1103.20 20.69 25.8%
10 iter.1592.80 20.81 31.8%
cache inv. w/overlap 975.20 21.57 26.5%
1 iter. w/overlap1122.06 22.13 24.5%
10 iter. w/overlap1585.20 21.41 31.8%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 964.22 19.57 25.5%
1 iter.1089.16 18.95 24.9%
10 iter.1613.32 18.36 32.9%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5983e-02   2.5374e-05   161.43   0.40   0.26   0.91 
  4096   1.9230e-02   3.7558e-05   218.12   0.36   0.43   0.49 
  8192   1.3372e-02   5.2234e-05   313.66   0.23   0.26   0.34 
  16384   1.0173e-02   7.9476e-05   412.30   0.15   0.18   0.22 
  32768   8.5740e-03   1.3397e-04   489.19   0.08   0.09   0.12 
  65536   6.6470e-03   2.0772e-04   631.01   0.05   0.06   0.09 
  131072   5.3359e-03   3.3349e-04   786.06   0.04   0.05   0.06 
  262144   4.7365e-03   5.9206e-04   885.52   0.03   0.03   0.05 
  524288   4.4815e-03   1.1204e-03   935.92   0.02   0.02   0.03 
  1048576   4.3410e-03   2.1705e-03   966.21   0.01   0.01   0.03 
  2097152   4.4788e-03   4.4788e-03   936.47   0.01   0.02   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   1   2   6   3 
  4096   4   5   0   10   7 
  8192   4   5   0   10   2 
  16384   4   5   0   10   7 
  32768   4   5   10   8   2 
  65536   4   5   0   1   10 
  131072   4   5   10   0   3 
  262144   4   6   5   2   10 
  524288   4   2   0   7   5 
  1048576   2   6   5   7   0 
  2097152   1   6   0   5   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   5 
  4096    1   1   2 
  8192    1   2   4 
  16384    1   2   11 
  32768    1   2   11 
  65536    2   3   11 
  131072    1   5   11 
  262144    1   11   11 
  524288    2   11   11 
  1048576    5   11   11 
  2097152    4   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.4509e-02   2.3935e-05   171.13   0.45   0.31   0.99 
  4096   1.9572e-02   3.8227e-05   214.30   0.29   0.34   0.42 
  8192   1.2373e-02   4.8334e-05   338.97   0.26   0.30   0.37 
  16384   9.5487e-03   7.4599e-05   439.25   0.13   0.15   0.20 
  32768   7.5870e-03   1.1855e-04   552.83   0.11   0.12   0.16 
  65536   5.8230e-03   1.8197e-04   720.30   0.08   0.09   0.11 
  131072   4.7231e-03   2.9520e-04   888.03   0.05   0.05   0.07 
  262144   4.1688e-03   5.2110e-04   1006.12   0.04   0.04   0.06 
  524288   3.9040e-03   9.7600e-04   1074.36   0.02   0.01   0.04 
  1048576   3.7406e-03   1.8703e-03   1121.30   0.02   0.02   0.04 
  2097152   3.6249e-03   3.6249e-03   1157.08   0.03   0.03   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   4   5   0   10   1 
  8192   4   5   10   0   8 
  16384   4   5   0   10   2 
  32768   4   5   10   1   8 
  65536   4   5   0   8   10 
  131072   5   4   10   6   2 
  262144   5   0   4   8   2 
  524288   6   5   8   0   10 
  1048576   5   6   2   1   4 
  2097152   6   7   8   1   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   5 
  4096    1   2   2 
  8192    1   2   2 
  16384    2   2   11 
  32768    1   2   11 
  65536    1   2   11 
  131072    2   4   11 
  262144    1   9   11 
  524288    3   11   11 
  1048576    3   11   11 
  2097152    1   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1116e-02   2.0621e-05   198.63   0.51   0.31   1.16 
  4096   1.5481e-02   3.0237e-05   270.93   0.43   0.51   0.61 
  8192   9.3922e-03   3.6688e-05   446.57   0.33   0.38   0.47 
  16384   6.2905e-03   4.9144e-05   666.77   0.24   0.28   0.35 
  32768   4.7120e-03   7.3625e-05   890.13   0.17   0.20   0.24 
  65536   3.3120e-03   1.0350e-04   1266.41   0.13   0.16   0.18 
  131072   2.6995e-03   1.6872e-04   1553.73   0.09   0.11   0.14 
  262144   2.4435e-03   3.0544e-04   1716.51   0.06   0.07   0.08 
  524288   2.7106e-03   6.7765e-04   1547.37   0.04   0.04   0.05 
  1048576   3.5608e-03   1.7804e-03   1177.91   0.03   0.03   0.04 
  2097152   3.8428e-03   3.8428e-03   1091.47   0.02   0.02   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   4   5   10   0   2 
  8192   4   5   0   10   1 
  16384   4   5   10   0   8 
  32768   4   5   0   10   2 
  65536   4   5   2   10   0 
  131072   4   5   10   0   2 
  262144   4   5   2   8   10 
  524288   5   2   4   8   1 
  1048576   4   0   5   2   3 
  2097152   9   2   4   1   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   5 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   2   4 
  32768    1   2   11 
  65536    1   2   11 
  131072    1   2   11 
  262144    1   2   11 
  524288    1   9   11 
  1048576    1   11   11 
  2097152    3   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.6604e-02   2.5980e-05   157.66   0.38   0.16   0.92 
  4096   1.8440e-02   3.6016e-05   227.46   0.43   0.53   0.57 
  8192   1.2632e-02   4.9345e-05   332.03   0.31   0.37   0.41 
  16384   9.7800e-03   7.6407e-05   428.86   0.20   0.24   0.28 
  32768   8.3461e-03   1.3041e-04   502.55   0.12   0.14   0.16 
  65536   6.4066e-03   2.0021e-04   654.68   0.10   0.12   0.14 
  131072   5.3721e-03   3.3576e-04   780.76   0.04   0.05   0.06 
  262144   4.7660e-03   5.9575e-04   880.05   0.03   0.04   0.05 
  524288   4.4810e-03   1.1202e-03   936.03   0.02   0.02   0.03 
  1048576   4.3499e-03   2.1750e-03   964.22   0.01   0.01   0.03 
  2097152   4.5121e-03   4.5121e-03   929.57   0.01   0.01   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   6 
  4096   4   5   10   0   2 
  8192   4   5   10   0   7 
  16384   4   5   0   10   9 
  32768   4   5   10   0   2 
  65536   4   5   10   0   7 
  131072   4   5   10   8   2 
  262144   5   4   10   6   7 
  524288   4   2   5   8   3 
  1048576   10   1   0   2   8 
  2097152   6   2   5   3   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   2   2 
  8192    1   2   2 
  16384    1   2   8 
  32768    1   2   11 
  65536    1   2   11 
  131072    2   4   11 
  262144    2   11   11 
  524288    2   11   11 
  1048576    6   11   11 
  2097152    8   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5589e-02   2.4989e-05   163.91   0.40   0.18   0.97 
  4096   1.7228e-02   3.3649e-05   243.45   0.48   0.58   0.65 
  8192   1.1739e-02   4.5856e-05   357.30   0.34   0.40   0.45 
  16384   8.8381e-03   6.9047e-05   474.57   0.23   0.28   0.32 
  32768   7.5550e-03   1.1805e-04   555.17   0.13   0.15   0.17 
  65536   5.7521e-03   1.7975e-04   729.18   0.09   0.11   0.14 
  131072   4.6890e-03   2.9306e-04   894.50   0.06   0.06   0.08 
  262144   4.2050e-03   5.2562e-04   997.46   0.03   0.03   0.04 
  524288   3.8620e-03   9.6551e-04   1086.04   0.03   0.04   0.06 
  1048576   3.8010e-03   1.9005e-03   1103.48   0.01   0.01   0.01 
  2097152   3.6820e-03   3.6820e-03   1139.13   0.02   0.01   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   6 
  4096   4   5   10   0   7 
  8192   4   5   0   10   7 
  16384   4   5   10   0   2 
  32768   5   4   10   0   7 
  65536   5   4   10   2   6 
  131072   4   5   0   10   3 
  262144   4   5   1   10   0 
  524288   4   9   6   5   7 
  1048576   4   9   6   7   0 
  2097152   0   10   3   9   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   2 
  8192    1   2   2 
  16384    1   2   3 
  32768    2   2   11 
  65536    2   2   11 
  131072    1   2   11 
  262144    2   11   11 
  524288    2   10   11 
  1048576    6   11   11 
  2097152    3   10   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1803e-02   2.1292e-05   192.37   0.46   0.20   1.15 
  4096   1.4139e-02   2.7614e-05   296.66   0.58   0.69   0.82 
  8192   8.6644e-03   3.3845e-05   484.08   0.46   0.55   0.60 
  16384   5.9016e-03   4.6106e-05   710.71   0.34   0.39   0.45 
  32768   4.4659e-03   6.9780e-05   939.18   0.23   0.28   0.31 
  65536   3.2314e-03   1.0098e-04   1297.97   0.17   0.20   0.21 
  131072   2.6273e-03   1.6421e-04   1596.43   0.13   0.15   0.18 
  262144   2.4268e-03   3.0335e-04   1728.32   0.07   0.08   0.09 
  524288   2.7156e-03   6.7890e-04   1544.52   0.04   0.04   0.06 
  1048576   3.6473e-03   1.8237e-03   1149.97   0.01   0.01   0.02 
  2097152   3.8755e-03   3.8755e-03   1082.26   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   6 
  4096   4   5   10   0   2 
  8192   4   5   10   0   2 
  16384   4   5   10   0   1 
  32768   4   5   10   0   1 
  65536   4   5   0   10   2 
  131072   4   5   0   8   10 
  262144   5   4   0   10   2 
  524288   5   4   6   3   7 
  1048576   5   4   8   10   0 
  2097152   0   9   2   4   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   2   2 
  32768    1   2   2 
  65536    1   2   11 
  131072    1   2   11 
  262144    2   2   11 
  524288    1   9   11 
  1048576    4   11   11 
  2097152    4   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:22:24 EDT.
86437 accesses since 1/2/96.