COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 128KB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 1, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 757.70 9.53 43.9%
1 iter.1534.68 9.62 45.0%
10 iter.1681.36 9.52 42.6%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 707.94 11.17 38.8%
1 iter.1502.20 10.91 41.2%
10 iter.1638.69 10.85 39.6%
cache inv. w/overlap 709.47 11.22 38.4%
1 iter. w/overlap1496.37 11.07 41.9%
10 iter. w/overlap1718.68 10.95 40.5%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 724.10 10.65 41.0%
1 iter.1418.84 10.66 42.6%
10 iter.1619.21 10.60 39.1%
cache inv. w/overlap 723.75 10.91 39.4%
1 iter. w/overlap1461.66 10.84 42.0%
10 iter. w/overlap1770.06 10.66 41.4%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 692.21 11.75 37.4%
1 iter.1398.75 11.73 41.2%
10 iter.1568.92 11.79 33.7%
cache inv. w/overlap 717.94 12.07 35.6%
1 iter. w/overlap1452.37 12.20 33.5%
10 iter. w/overlap1706.61 11.96 38.5%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 740.02 13.45 19.8%
1 iter.1579.31 13.67 16.5%
10 iter.1819.27 13.57 23.3%
cache inv. w/overlap 770.80 11.27 21.5%
1 iter. w/overlap1719.95 11.28 14.8%
10 iter. w/overlap2089.22 11.07 17.6%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 779.45 14.30 23.0%
1 iter.1559.76 14.60 17.4%
10 iter.1761.74 14.46 24.3%
cache inv. w/overlap 791.91 12.09 22.1%
1 iter. w/overlap1660.96 11.98 15.2%
10 iter. w/overlap1985.64 11.96 18.1%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 737.80 11.05 41.6%
1 iter.1482.04 11.07 42.3%
10 iter.1626.94 11.03 40.2%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 732.76 22.07 14.5%
1 iter.1428.42 22.12 24.1%
10 iter.1601.17 22.04 26.9%
cache inv. w/overlap 723.36 22.37 15.1%
1 iter. w/overlap1406.86 22.27 23.9%
10 iter. w/overlap1717.30 21.78 28.5%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 715.69 22.05 16.2%
1 iter.1426.14 22.01 24.0%
10 iter.1636.46 22.07 27.6%
cache inv. w/overlap 717.57 22.18 14.5%
1 iter. w/overlap1531.33 22.08 25.8%
10 iter. w/overlap1744.08 21.86 29.1%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 719.23 21.78 17.7%
1 iter.1415.26 21.73 23.5%
10 iter.1579.60 22.07 26.6%
cache inv. w/overlap 720.55 21.36 16.2%
1 iter. w/overlap1476.48 21.14 23.8%
10 iter. w/overlap1741.88 22.95 30.5%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 734.68 21.22 17.1%
1 iter.1539.85 21.07 24.8%
10 iter.1669.48 21.05 26.8%


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.0078e-02   1.9607e-05   13.06   0.59   0.40   1.27 
  256   1.0322e-02   2.0159e-05   25.40   0.57   0.39   1.25 
  512   5.5553e-03   2.1700e-05   47.19   0.54   0.37   1.22 
  1024   3.0339e-03   2.3703e-05   86.40   0.48   0.31   1.08 
  2048   1.7734e-03   2.7709e-05   147.82   0.40   0.27   0.90 
  4096   1.1095e-03   3.4671e-05   236.28   0.34   0.22   0.80 
  8192   9.1369e-04   5.7106e-05   286.91   0.25   0.30   0.33 
  16384   6.8931e-04   8.6163e-05   380.30   0.16   0.19   0.21 
  32768   5.7557e-04   1.4389e-04   455.45   0.09   0.10   0.14 
  65536   4.2955e-04   2.1477e-04   610.28   0.07   0.08   0.12 
  131072   3.4599e-04   3.4599e-04   757.67   0.04   0.04   0.07 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   1   2   6   3 
  512   0   2   1   6   3 
  1024   0   2   1   6   3 
  2048   0   2   6   1   3 
  4096   0   2   1   6   3 
  8192   4   5   10   0   1 
  16384   4   5   10   0   8 
  32768   4   5   7   0   2 
  65536   4   5   7   10   9 
  131072   5   4   1   0   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   5 
  1024    1   1   5 
  2048    1   1   5 
  4096    1   1   6 
  8192    1   2   2 
  16384    1   2   11 
  32768    1   2   11 
  65536    2   2   11 
  131072    2   7   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.9965e-02   1.9497e-05   13.13   0.59   0.41   1.28 
  256   1.0112e-02   1.9749e-05   25.93   0.58   0.39   1.26 
  512   5.1758e-03   2.0218e-05   50.65   0.57   0.39   1.25 
  1024   2.7150e-03   2.1211e-05   96.55   0.54   0.37   1.21 
  2048   1.4575e-03   2.2774e-05   179.85   0.50   0.34   1.13 
  4096   8.0756e-04   2.5236e-05   324.61   0.47   0.32   1.05 
  8192   6.4264e-04   4.0165e-05   407.92   0.35   0.42   0.49 
  16384   4.1493e-04   5.1867e-05   631.77   0.28   0.34   0.38 
  32768   3.0908e-04   7.7270e-05   848.14   0.18   0.21   0.26 
  65536   2.0819e-04   1.0409e-04   1259.18   0.17   0.20   0.27 
  131072   1.6683e-04   1.6683e-04   1571.36   0.14   0.13   0.30 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   1   2   6   3 
  1024   0   2   1   6   3 
  2048   0   2   1   6   3 
  4096   0   2   6   1   3 
  8192   4   5   0   10   1 
  16384   4   5   10   0   2 
  32768   4   5   0   10   2 
  65536   4   5   10   2   0 
  131072   4   5   10   1   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   5 
  1024    1   1   5 
  2048    1   1   5 
  4096    1   1   5 
  8192    1   1   2 
  16384    1   2   2 
  32768    1   2   10 
  65536    1   1   9 
  131072    1   1   9 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.9766e-02   1.9303e-05   13.26   0.60   0.41   1.29 
  256   1.0022e-02   1.9574e-05   26.16   0.59   0.40   1.27 
  512   5.0981e-03   1.9915e-05   51.42   0.57   0.40   1.25 
  1024   2.6300e-03   2.0547e-05   99.68   0.55   0.38   1.21 
  2048   1.3870e-03   2.1671e-05   189.01   0.53   0.36   1.22 
  4096   7.5221e-04   2.3507e-05   348.50   0.47   0.31   1.06 
  8192   5.6463e-04   3.5289e-05   464.28   0.38   0.45   0.52 
  16384   3.4239e-04   4.2798e-05   765.64   0.33   0.39   0.45 
  32768   2.3703e-04   5.9257e-05   1105.96   0.25   0.29   0.34 
  65536   1.6088e-04   8.0441e-05   1629.42   0.20   0.23   0.27 
  131072   1.4766e-04   1.4766e-04   1775.31   0.09   0.11   0.15 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   1   2   6   3 
  1024   0   1   2   6   3 
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   0   10   9 
  16384   4   5   0   10   8 
  32768   4   5   10   0   2 
  65536   4   5   0   8   10 
  131072   4   5   0   10   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   5 
  1024    1   1   5 
  2048    1   2   5 
  4096    1   1   5 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   2 
  65536    1   2   8 
  131072    2   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.0283e-02   1.9808e-05   12.92   0.54   0.24   1.28 
  256   1.0346e-02   2.0207e-05   25.34   0.53   0.24   1.25 
  512   5.7125e-03   2.2315e-05   45.89   0.46   0.21   1.11 
  1024   3.0823e-03   2.4080e-05   85.05   0.41   0.15   1.01 
  2048   1.7237e-03   2.6933e-05   152.08   0.41   0.19   0.96 
  4096   1.1307e-03   3.5334e-05   231.84   0.28   0.13   0.70 
  8192   8.3177e-04   5.1986e-05   315.16   0.34   0.40   0.45 
  16384   6.4843e-04   8.1053e-05   404.28   0.22   0.25   0.29 
  32768   5.4820e-04   1.3705e-04   478.19   0.14   0.16   0.19 
  65536   4.1124e-04   2.0562e-04   637.45   0.11   0.13   0.15 
  131072   3.3432e-04   3.3432e-04   784.11   0.06   0.07   0.11 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   6   1   4 
  256   0   2   6   1   4 
  512   0   2   1   6   4 
  1024   0   2   1   4   6 
  2048   0   2   1   6   4 
  4096   0   2   1   4   6 
  8192   4   5   0   9   10 
  16384   5   4   0   9   10 
  32768   4   5   0   10   2 
  65536   4   5   8   6   0 
  131072   4   5   0   2   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   7 
  256    1   1   7 
  512    1   1   7 
  1024    1   1   7 
  2048    1   1   7 
  4096    1   2   7 
  8192    1   2   2 
  16384    2   2   5 
  32768    2   2   11 
  65536    1   2   11 
  131072    1   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   2.0009e-02   1.9540e-05   13.10   0.55   0.24   1.29 
  256   1.0115e-02   1.9756e-05   25.92   0.54   0.24   1.28 
  512   5.2199e-03   2.0390e-05   50.22   0.52   0.24   1.24 
  1024   2.7207e-03   2.1255e-05   96.35   0.50   0.23   1.21 
  2048   1.4487e-03   2.2635e-05   180.96   0.45   0.18   1.11 
  4096   8.0864e-04   2.5270e-05   324.18   0.42   0.18   0.99 
  8192   5.5712e-04   3.4820e-05   470.53   0.50   0.59   0.67 
  16384   3.7851e-04   4.7313e-05   692.57   0.36   0.43   0.46 
  32768   2.7988e-04   6.9970e-05   936.63   0.27   0.32   0.39 
  65536   2.0145e-04   1.0073e-04   1301.26   0.19   0.22   0.28 
  131072   1.5544e-04   1.5544e-04   1686.46   0.19   0.21   0.37 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   4 
  256   0   2   1   6   4 
  512   0   2   6   1   4 
  1024   0   1   2   6   4 
  2048   0   2   1   6   4 
  4096   0   2   1   6   4 
  8192   4   5   0   3   10 
  16384   4   5   10   1   0 
  32768   4   5   0   10   7 
  65536   4   5   10   0   1 
  131072   4   5   10   0   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   6 
  256    1   1   7 
  512    1   1   6 
  1024    1   1   7 
  2048    1   1   7 
  4096    1   1   7 
  8192    1   1   2 
  16384    1   2   2 
  32768    1   1   2 
  65536    1   2   8 
  131072    1   1   9 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.9877e-02   1.9411e-05   13.19   0.56   0.24   1.37 
  256   1.0049e-02   1.9626e-05   26.09   0.55   0.24   1.35 
  512   5.1189e-03   1.9996e-05   51.21   0.54   0.23   1.33 
  1024   2.6366e-03   2.0599e-05   99.42   0.52   0.22   1.28 
  2048   1.3904e-03   2.1725e-05   188.54   0.49   0.21   1.20 
  4096   7.5526e-04   2.3602e-05   347.09   0.42   0.15   1.01 
  8192   4.9162e-04   3.0726e-05   533.23   0.58   0.70   0.78 
  16384   3.0758e-04   3.8447e-05   852.28   0.44   0.49   0.62 
  32768   2.1843e-04   5.4608e-05   1200.12   0.33   0.39   0.45 
  65536   1.5353e-04   7.6767e-05   1707.41   0.23   0.28   0.32 
  131072   1.2888e-04   1.2888e-04   2034.02   0.17   0.20   0.24 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   4 
  256   0   2   1   6   4 
  512   0   2   1   4   6 
  1024   0   2   1   4   6 
  2048   0   2   1   4   6 
  4096   0   2   4   1   6 
  8192   4   5   0   10   8 
  16384   4   5   10   2   8 
  32768   4   5   10   0   8 
  65536   4   5   0   10   2 
  131072   4   5   0   8   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   7 
  256    1   1   7 
  512    1   1   7 
  1024    1   1   7 
  2048    1   1   7 
  4096    1   1   7 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   2 
  65536    1   2   3 
  131072    1   2   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:36 EDT.
80635 accesses since 1/2/96.