COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 2MB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1070.69 9.48 48.4%
1 iter.1088.52 9.34 48.8%
10 iter.1558.92 9.77 41.5%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1069.57 10.95 45.5%
1 iter.1099.41 10.98 45.6%
10 iter.1529.08 10.67 40.0%
cache inv. w/overlap1077.16 10.66 46.8%
1 iter. w/overlap1097.33 10.52 47.0%
10 iter. w/overlap1500.59 11.06 38.3%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1065.85 10.52 46.6%
1 iter.1090.83 10.89 45.7%
10 iter.1530.02 9.61 42.6%
cache inv. w/overlap1079.82 10.22 47.9%
1 iter. w/overlap1092.10 10.19 48.2%
10 iter. w/overlap1491.96 10.84 38.5%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1072.71 11.85 44.8%
1 iter.1080.69 11.94 43.9%
10 iter.1502.63 11.95 33.6%
cache inv. w/overlap1073.75 11.72 40.6%
1 iter. w/overlap1091.83 11.66 41.3%
10 iter. w/overlap1478.95 12.47 35.3%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1083.75 13.29 26.7%
1 iter.1097.79 13.38 26.2%
10 iter.1720.44 13.66 36.8%
cache inv. w/overlap1090.60 10.95 27.8%
1 iter. w/overlap1090.77 10.72 27.8%
10 iter. w/overlap1741.93 11.26 38.1%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1077.41 15.19 24.3%
1 iter.1116.23 15.09 25.1%
10 iter.1692.60 15.85 35.9%
cache inv. w/overlap1086.44 11.92 28.0%
1 iter. w/overlap1115.38 11.70 28.3%
10 iter. w/overlap1722.18 12.45 37.2%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1063.28 11.01 46.0%
1 iter.1097.23 11.11 46.2%
10 iter.1523.04 11.24 39.2%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1072.82 21.58 23.7%
1 iter.1107.84 21.52 23.7%
10 iter.1522.58 22.95 28.8%
cache inv. w/overlap1069.11 20.61 25.3%
1 iter. w/overlap1104.87 20.40 26.6%
10 iter. w/overlap1516.62 22.35 28.8%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1078.96 23.14 21.7%
1 iter.1102.04 23.06 21.1%
10 iter.1532.32 21.96 28.9%
cache inv. w/overlap1080.08 22.20 23.5%
1 iter. w/overlap1105.76 22.40 23.6%
10 iter. w/overlap1509.93 22.27 28.4%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1070.72 22.03 24.8%
1 iter.1086.89 21.82 24.4%
10 iter.1508.43 24.04 28.4%
cache inv. w/overlap1078.58 22.08 22.2%
1 iter. w/overlap1093.60 21.78 22.7%
10 iter. w/overlap1493.58 23.93 28.0%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1090.81 21.59 23.1%
1 iter.1113.00 21.61 23.3%
10 iter.1562.74 21.31 30.4%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5985e-02   2.5376e-05   161.41   0.47   0.31   1.03 
  4096   1.6275e-02   3.1786e-05   257.72   0.37   0.25   0.85 
  8192   1.3081e-02   5.1099e-05   320.63   0.28   0.34   0.38 
  16384   9.4164e-03   7.3565e-05   445.43   0.20   0.23   0.27 
  32768   7.6018e-03   1.1878e-04   551.75   0.13   0.15   0.18 
  65536   5.7784e-03   1.8058e-04   725.86   0.09   0.11   0.12 
  131072   4.7964e-03   2.9977e-04   874.47   0.05   0.06   0.09 
  262144   4.3835e-03   5.4794e-04   956.83   0.03   0.04   0.05 
  524288   4.1923e-03   1.0481e-03   1000.47   0.01   0.01   0.03 
  1048576   3.9747e-03   1.9874e-03   1055.25   0.02   0.02   0.03 
  2097152   3.8068e-03   3.8068e-03   1101.79   0.01   0.01   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   0   10   2 
  16384   4   5   0   10   8 
  32768   4   5   10   0   2 
  65536   4   5   0   10   8 
  131072   4   5   0   2   10 
  262144   4   5   8   3   2 
  524288   4   5   10   1   9 
  1048576   4   7   1   5   9 
  2097152   4   5   6   8   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   5 
  4096    1   1   5 
  8192    1   2   2 
  16384    1   2   8 
  32768    1   2   11 
  65536    1   2   11 
  131072    2   4   11 
  262144    2   10   11 
  524288    5   11   11 
  1048576    1   11   11 
  2097152    5   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5782e-02   2.5178e-05   162.68   0.47   0.32   1.03 
  4096   1.6221e-02   3.1682e-05   258.57   0.36   0.26   0.85 
  8192   1.2884e-02   5.0330e-05   325.53   0.29   0.34   0.39 
  16384   9.2176e-03   7.2012e-05   455.03   0.21   0.25   0.29 
  32768   7.4975e-03   1.1715e-04   559.42   0.12   0.14   0.17 
  65536   5.7825e-03   1.8070e-04   725.34   0.08   0.09   0.11 
  131072   4.7268e-03   2.9543e-04   887.35   0.05   0.06   0.08 
  262144   4.2975e-03   5.3719e-04   975.99   0.03   0.03   0.05 
  524288   4.0932e-03   1.0233e-03   1024.70   0.02   0.02   0.03 
  1048576   3.9133e-03   1.9567e-03   1071.80   0.01   0.01   0.03 
  2097152   3.6652e-03   3.6652e-03   1144.36   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   0   10   8 
  16384   4   5   0   10   2 
  32768   4   5   0   10   8 
  65536   5   4   10   0   8 
  131072   4   5   0   10   1 
  262144   4   5   6   2   10 
  524288   5   4   10   7   1 
  1048576   5   7   9   10   1 
  2097152   2   8   10   4   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   5 
  4096    1   1   5 
  8192    1   2   2 
  16384    1   2   5 
  32768    1   2   11 
  65536    2   2   11 
  131072    2   2   11 
  262144    1   10   11 
  524288    3   11   11 
  1048576    7   11   11 
  2097152    4   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2275e-02   2.1753e-05   188.30   0.53   0.35   1.22 
  4096   1.2268e-02   2.3961e-05   341.88   0.47   0.32   1.05 
  8192   9.2699e-03   3.6211e-05   452.46   0.38   0.45   0.51 
  16384   5.7689e-03   4.5070e-05   727.05   0.31   0.36   0.43 
  32768   4.0218e-03   6.2840e-05   1042.90   0.24   0.28   0.32 
  65536   2.8314e-03   8.8480e-05   1481.37   0.18   0.21   0.24 
  131072   2.4379e-03   1.5237e-04   1720.44   0.10   0.12   0.14 
  262144   2.9304e-03   3.6630e-04   1431.32   0.04   0.05   0.06 
  524288   3.8897e-03   9.7244e-04   1078.30   0.01   0.01   0.02 
  1048576   3.9438e-03   1.9719e-03   1063.53   0.01   0.01   0.02 
  2097152   3.8720e-03   3.8720e-03   1083.24   0.00   0.00   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   0   10   2 
  16384   4   5   0   10   8 
  32768   4   5   0   10   2 
  65536   4   5   0   10   2 
  131072   4   5   10   0   8 
  262144   4   5   10   0   6 
  524288   5   4   10   0   6 
  1048576   4   5   0   8   10 
  2097152   0   8   10   6   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   5 
  4096    1   1   5 
  8192    1   1   2 
  16384    1   2   2 
  32768    1   2   2 
  65536    1   2   11 
  131072    1   2   11 
  262144    1   9   11 
  524288    4   11   11 
  1048576    5   11   11 
  2097152    11   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5820e-02   2.5215e-05   162.44   0.42   0.20   0.99 
  4096   1.6379e-02   3.1990e-05   256.08   0.32   0.15   0.79 
  8192   1.1845e-02   4.6270e-05   354.09   0.38   0.44   0.51 
  16384   8.9085e-03   6.9598e-05   470.82   0.25   0.29   0.33 
  32768   7.2722e-03   1.1363e-04   576.76   0.17   0.20   0.22 
  65536   5.7760e-03   1.8050e-04   726.16   0.09   0.10   0.13 
  131072   4.7081e-03   2.9426e-04   890.87   0.07   0.08   0.09 
  262144   4.3357e-03   5.4196e-04   967.40   0.04   0.04   0.06 
  524288   4.1579e-03   1.0395e-03   1008.76   0.02   0.01   0.04 
  1048576   3.9785e-03   1.9892e-03   1054.25   0.01   0.01   0.03 
  2097152   3.8132e-03   3.8132e-03   1099.95   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   4 
  4096   0   2   4   1   6 
  8192   4   5   9   3   0 
  16384   4   5   0   9   10 
  32768   4   5   10   9   0 
  65536   4   5   3   9   10 
  131072   5   4   10   0   9 
  262144   5   4   8   0   10 
  524288   4   5   2   8   10 
  1048576   4   8   0   9   6 
  2097152   6   10   2   5   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   7 
  8192    1   2   2 
  16384    1   2   2 
  32768    1   2   11 
  65536    2   2   11 
  131072    1   2   11 
  262144    2   8   11 
  524288    3   11   11 
  1048576    2   11   11 
  2097152    4   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5856e-02   2.5250e-05   162.22   0.41   0.19   0.99 
  4096   1.6271e-02   3.1780e-05   257.78   0.33   0.15   0.78 
  8192   1.1803e-02   4.6107e-05   355.35   0.38   0.43   0.50 
  16384   8.8197e-03   6.8904e-05   475.56   0.25   0.29   0.33 
  32768   7.2279e-03   1.1294e-04   580.30   0.16   0.19   0.22 
  65536   5.6227e-03   1.7571e-04   745.97   0.11   0.13   0.13 
  131072   4.6577e-03   2.9110e-04   900.52   0.07   0.08   0.09 
  262144   4.2499e-03   5.3124e-04   986.92   0.04   0.05   0.06 
  524288   4.0879e-03   1.0220e-03   1026.02   0.01   0.01   0.03 
  1048576   3.9102e-03   1.9551e-03   1072.66   0.01   0.01   0.02 
  2097152   3.6955e-03   3.6955e-03   1134.99   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   4 
  4096   0   2   1   6   4 
  8192   4   5   3   9   10 
  16384   4   5   3   0   10 
  32768   4   5   10   9   0 
  65536   4   5   9   0   8 
  131072   4   5   10   0   6 
  262144   5   4   0   9   3 
  524288   4   10   5   0   2 
  1048576   7   10   2   3   9 
  2097152   0   5   8   4   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   7 
  8192    1   2   2 
  16384    1   2   2 
  32768    1   2   11 
  65536    1   2   11 
  131072    1   2   11 
  262144    1   6   11 
  524288    4   11   11 
  1048576    4   11   11 
  2097152    8   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2411e-02   2.1886e-05   187.16   0.48   0.20   1.19 
  4096   1.2389e-02   2.4198e-05   338.54   0.41   0.15   0.99 
  8192   8.1067e-03   3.1667e-05   517.39   0.57   0.68   0.76 
  16384   5.1988e-03   4.0616e-05   806.78   0.42   0.47   0.59 
  32768   3.7942e-03   5.9284e-05   1105.45   0.30   0.37   0.40 
  65536   2.7538e-03   8.6056e-05   1523.10   0.21   0.25   0.29 
  131072   2.4078e-03   1.5049e-04   1741.93   0.13   0.15   0.18 
  262144   2.8775e-03   3.5969e-04   1457.61   0.05   0.06   0.08 
  524288   3.8279e-03   9.5698e-04   1095.71   0.03   0.03   0.04 
  1048576   3.9594e-03   1.9797e-03   1059.34   0.01   0.01   0.02 
  2097152   3.8728e-03   3.8728e-03   1083.02   0.01   0.01   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   4   6 
  4096   0   2   4   1   6 
  8192   4   5   0   10   2 
  16384   4   5   10   0   2 
  32768   4   5   0   10   1 
  65536   4   5   0   10   7 
  131072   4   5   10   0   7 
  262144   5   4   10   0   7 
  524288   5   4   10   2   6 
  1048576   5   4   10   0   6 
  2097152   4   6   10   1   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   7 
  8192    1   1   2 
  16384    1   2   2 
  32768    1   2   2 
  65536    1   2   5 
  131072    1   2   11 
  262144    2   3   11 
  524288    2   11   11 
  1048576    5   11   11 
  2097152    8   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:20 EDT.
81880 accesses since 1/2/96.