COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 2MB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1071.65 7.50 41.6%
1 iter.1123.80 7.13 43.4%
10 iter.1731.48 7.13 42.1%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1082.64 8.81 39.8%
1 iter.1141.46 8.66 40.3%
10 iter.1731.05 8.38 38.1%
cache inv. w/overlap1079.56 9.04 37.6%
1 iter. w/overlap1122.24 9.17 36.8%
10 iter. w/overlap1712.98 8.85 37.5%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1093.29 8.25 41.5%
1 iter.1150.50 8.15 42.7%
10 iter.1720.88 7.99 40.1%
cache inv. w/overlap1094.40 7.66 42.9%
1 iter. w/overlap1154.40 7.59 44.8%
10 iter. w/overlap1693.86 8.14 38.8%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1104.43 9.07 41.6%
1 iter.1130.46 9.09 40.6%
10 iter.1713.21 8.98 37.7%
cache inv. w/overlap1105.84 9.15 38.6%
1 iter. w/overlap1134.18 9.27 38.6%
10 iter. w/overlap1699.05 9.62 37.2%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1082.51 9.80 28.2%
1 iter.1128.87 10.02 28.0%
10 iter.1780.48 10.01 39.7%
cache inv. w/overlap1109.55 7.79 29.8%
1 iter. w/overlap1140.79 7.89 29.4%
10 iter. w/overlap1806.51 7.68 39.4%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1110.15 11.57 27.0%
1 iter.1137.70 11.56 27.5%
10 iter.1766.47 10.78 38.7%
cache inv. w/overlap1103.89 8.93 28.7%
1 iter. w/overlap1139.85 9.17 28.1%
10 iter. w/overlap1777.25 9.08 38.9%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1095.22 10.79 34.2%
1 iter.1124.39 10.80 33.6%
10 iter.1703.37 8.92 38.1%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1070.98 15.69 22.9%
1 iter.1135.36 15.95 23.7%
10 iter.1731.17 15.24 37.4%
cache inv. w/overlap1088.58 15.16 25.0%
1 iter. w/overlap1138.25 15.45 24.4%
10 iter. w/overlap1705.77 14.91 36.8%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1100.61 16.02 24.0%
1 iter.1128.07 15.52 25.5%
10 iter.1723.32 15.55 37.0%
cache inv. w/overlap1095.10 15.68 25.1%
1 iter. w/overlap1145.93 15.53 25.7%
10 iter. w/overlap1710.80 15.63 36.9%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1088.76 16.59 24.6%
1 iter.1126.88 16.26 24.5%
10 iter.1726.52 16.57 37.4%
cache inv. w/overlap1101.84 15.95 25.5%
1 iter. w/overlap1131.68 16.11 24.6%
10 iter. w/overlap1692.74 15.98 36.2%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1085.27 14.87 24.5%
1 iter.1148.40 14.61 25.3%
10 iter.1735.58 14.71 37.4%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.1207e-02   2.0710e-05   197.78   0.41   0.27   0.87 
  4096   1.3531e-02   2.6428e-05   309.97   0.32   0.25   0.68 
  8192   1.1016e-02   4.3032e-05   380.74   0.22   0.26   0.31 
  16384   8.4048e-03   6.5662e-05   499.04   0.14   0.16   0.19 
  32768   7.1392e-03   1.1155e-04   587.51   0.07   0.08   0.11 
  65536   5.5642e-03   1.7388e-04   753.81   0.05   0.06   0.08 
  131072   4.6589e-03   2.9118e-04   900.29   0.03   0.03   0.05 
  262144   4.2173e-03   5.2717e-04   994.54   0.02   0.02   0.04 
  524288   3.9457e-03   9.8644e-04   1062.99   0.02   0.02   0.04 
  1048576   3.8536e-03   1.9268e-03   1088.42   0.01   0.01   0.04 
  2097152   3.7462e-03   3.7462e-03   1119.62   0.02   0.02   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   6   3 
  8192   4   5   0   10   2 
  16384   4   5   0   10   7 
  32768   4   5   10   7   0 
  65536   4   5   10   0   7 
  131072   5   4   3   2   0 
  262144   1   4   0   6   8 
  524288   4   10   1   9   6 
  1048576   9   6   10   3   4 
  2097152   4   6   1   2   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   5 
  8192    1   1   4 
  16384    1   2   11 
  32768    2   2   11 
  65536    2   4   11 
  131072    2   10   11 
  262144    2   11   11 
  524288    2   11   11 
  1048576    5   11   11 
  2097152    2   10   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.0714e-02   2.0229e-05   202.49   0.42   0.30   0.89 
  4096   1.3418e-02   2.6207e-05   312.59   0.31   0.25   0.68 
  8192   1.0945e-02   4.2753e-05   383.22   0.20   0.24   0.30 
  16384   8.2767e-03   6.4662e-05   506.76   0.13   0.15   0.18 
  32768   6.9446e-03   1.0851e-04   603.97   0.08   0.09   0.11 
  65536   5.3979e-03   1.6869e-04   777.02   0.05   0.06   0.08 
  131072   4.5264e-03   2.8290e-04   926.63   0.03   0.03   0.04 
  262144   4.0805e-03   5.1006e-04   1027.88   0.03   0.03   0.05 
  524288   3.8601e-03   9.6503e-04   1086.57   0.01   0.01   0.03 
  1048576   3.7155e-03   1.8577e-03   1128.87   0.01   0.01   0.03 
  2097152   3.3986e-03   3.3986e-03   1234.14   0.04   0.04   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   6   3 
  8192   4   5   10   0   7 
  16384   4   5   10   0   7 
  32768   4   5   10   0   7 
  65536   4   5   0   3   7 
  131072   5   4   10   0   1 
  262144   4   5   6   10   0 
  524288   8   0   3   6   1 
  1048576   4   2   5   7   6 
  2097152   0   2   8   9   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   6 
  8192    1   1   8 
  16384    1   2   11 
  32768    1   2   11 
  65536    1   3   11 
  131072    2   11   11 
  262144    2   10   11 
  524288    5   11   11 
  1048576    5   11   11 
  2097152    1   10   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7492e-02   1.7082e-05   239.79   0.50   0.34   1.10 
  4096   1.0195e-02   1.9911e-05   411.43   0.44   0.30   0.94 
  8192   8.0363e-03   3.1392e-05   521.92   0.30   0.34   0.41 
  16384   5.4578e-03   4.2639e-05   768.50   0.22   0.25   0.30 
  32768   4.1821e-03   6.5345e-05   1002.92   0.13   0.15   0.19 
  65536   3.0899e-03   9.6561e-05   1357.41   0.09   0.10   0.13 
  131072   2.5290e-03   1.5806e-04   1658.49   0.06   0.07   0.09 
  262144   2.3557e-03   2.9446e-04   1780.48   0.03   0.03   0.05 
  524288   2.6177e-03   6.5442e-04   1602.30   0.01   0.01   0.02 
  1048576   3.6765e-03   1.8383e-03   1140.83   0.01   0.01   0.02 
  2097152   3.8827e-03   3.8827e-03   1080.25   0.01   0.01   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   3   6 
  8192   4   5   10   0   7 
  16384   4   5   0   10   7 
  32768   4   5   0   10   7 
  65536   4   5   0   10   1 
  131072   4   5   10   0   1 
  262144   4   5   10   0   7 
  524288   4   0   10   1   5 
  1048576   4   10   5   8   2 
  2097152   9   5   0   2   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   1   2 
  16384    1   1   6 
  32768    1   2   11 
  65536    1   2   11 
  131072    1   2   11 
  262144    2   11   11 
  524288    3   11   11 
  1048576    7   11   11 
  2097152    10   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.0361e-02   1.9884e-05   206.00   0.40   0.20   0.88 
  4096   1.3307e-02   2.5991e-05   315.18   0.29   0.15   0.65 
  8192   9.9865e-03   3.9010e-05   420.00   0.31   0.36   0.42 
  16384   7.9261e-03   6.1922e-05   529.18   0.18   0.21   0.26 
  32768   6.8044e-03   1.0632e-04   616.41   0.11   0.14   0.15 
  65536   5.4823e-03   1.7132e-04   765.06   0.06   0.07   0.08 
  131072   4.5745e-03   2.8591e-04   916.88   0.05   0.05   0.06 
  262144   4.1482e-03   5.1852e-04   1011.12   0.03   0.03   0.05 
  524288   3.9859e-03   9.9647e-04   1052.29   0.01   0.01   0.02 
  1048576   3.8455e-03   1.9227e-03   1090.71   0.01   0.01   0.02 
  2097152   3.7129e-03   3.7129e-03   1129.66   0.02   0.02   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   5 
  4096   0   2   4   1   3 
  8192   4   5   0   10   2 
  16384   4   5   10   1   0 
  32768   4   5   10   0   2 
  65536   4   5   7   0   10 
  131072   4   5   10   1   3 
  262144   5   4   0   1   10 
  524288   6   4   0   2   5 
  1048576   3   4   8   0   9 
  2097152   5   10   0   9   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   7 
  8192    1   1   2 
  16384    1   2   10 
  32768    1   2   11 
  65536    2   2   11 
  131072    1   5   11 
  262144    2   11   11 
  524288    6   11   11 
  1048576    4   11   11 
  2097152    3   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.0214e-02   1.9740e-05   207.49   0.40   0.22   0.89 
  4096   1.3237e-02   2.5853e-05   316.87   0.28   0.15   0.63 
  8192   9.8274e-03   3.8388e-05   426.80   0.31   0.36   0.42 
  16384   7.6999e-03   6.0155e-05   544.73   0.20   0.23   0.26 
  32768   6.6336e-03   1.0365e-04   632.28   0.12   0.13   0.17 
  65536   5.2421e-03   1.6381e-04   800.13   0.07   0.09   0.10 
  131072   4.4199e-03   2.7624e-04   948.97   0.05   0.06   0.07 
  262144   4.0557e-03   5.0697e-04   1034.17   0.02   0.02   0.03 
  524288   3.8227e-03   9.5566e-04   1097.22   0.02   0.02   0.03 
  1048576   3.7062e-03   1.8531e-03   1131.70   0.01   0.01   0.02 
  2097152   3.4378e-03   3.4378e-03   1220.04   0.04   0.04   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   5 
  4096   0   2   4   1   5 
  8192   4   5   10   0   7 
  16384   4   5   10   7   0 
  32768   4   5   0   10   7 
  65536   4   5   0   10   1 
  131072   4   5   0   8   7 
  262144   4   5   0   1   8 
  524288   4   9   5   8   6 
  1048576   5   4   3   6   0 
  2097152   0   5   10   8   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   7 
  8192    1   2   2 
  16384    1   2   9 
  32768    1   2   11 
  65536    2   2   11 
  131072    1   4   11 
  262144    1   11   11 
  524288    2   11   11 
  1048576    7   11   11 
  2097152    1   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7448e-02   1.7039e-05   240.39   0.46   0.25   1.05 
  4096   1.0236e-02   1.9992e-05   409.75   0.39   0.22   0.89 
  8192   6.9828e-03   2.7277e-05   600.66   0.46   0.50   0.64 
  16384   4.9640e-03   3.8781e-05   844.94   0.31   0.35   0.42 
  32768   3.9295e-03   6.1398e-05   1067.40   0.19   0.21   0.26 
  65536   2.9639e-03   9.2621e-05   1415.14   0.13   0.15   0.18 
  131072   2.5098e-03   1.5686e-04   1671.17   0.07   0.08   0.10 
  262144   2.3218e-03   2.9022e-04   1806.51   0.05   0.06   0.07 
  524288   2.6258e-03   6.5645e-04   1597.35   0.02   0.02   0.03 
  1048576   3.6210e-03   1.8105e-03   1158.32   0.01   0.01   0.01 
  2097152   3.8692e-03   3.8692e-03   1084.02   0.01   0.01   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   4   2   1   6 
  4096   0   2   4   1   6 
  8192   4   5   7   10   0 
  16384   4   5   0   10   7 
  32768   4   5   10   0   1 
  65536   4   5   10   0   1 
  131072   4   5   1   7   0 
  262144   4   5   10   0   1 
  524288   5   4   10   0   6 
  1048576   4   5   1   0   8 
  2097152   5   0   1   8   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   7 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   9 
  65536    1   2   11 
  131072    2   2   11 
  262144    1   3   11 
  524288    2   11   11 
  1048576    10   11   11 
  2097152    6   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:16 EDT.
81541 accesses since 1/2/96.