COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 128KB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 772.92 6.98 37.8%
1 iter.1716.80 7.02 40.2%
10 iter.1706.62 7.09 39.5%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 777.29 8.00 37.7%
1 iter.1701.06 8.09 38.2%
10 iter.1654.50 8.05 36.8%
cache inv. w/overlap 709.80 8.59 30.8%
1 iter. w/overlap1696.80 8.66 33.5%
10 iter. w/overlap1682.70 8.35 32.6%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 762.64 8.15 36.1%
1 iter.1716.80 7.97 38.1%
10 iter.1698.38 8.00 38.3%
cache inv. w/overlap 797.70 7.30 38.9%
1 iter. w/overlap1642.23 7.56 40.0%
10 iter. w/overlap1709.74 7.92 39.1%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 762.90 8.95 34.3%
1 iter.1661.10 9.19 35.5%
10 iter.1666.07 9.07 35.0%
cache inv. w/overlap 791.27 8.33 37.7%
1 iter. w/overlap1627.82 8.67 35.1%
10 iter. w/overlap1682.51 9.33 31.3%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 773.13 9.61 22.1%
1 iter.1690.52 9.76 12.6%
10 iter.1798.38 9.80 13.4%
cache inv. w/overlap 805.84 7.82 20.7%
1 iter. w/overlap1844.87 7.71 15.7%
10 iter. w/overlap1868.38 7.46 10.6%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 767.13 10.85 21.4%
1 iter.1645.26 11.01 13.8%
10 iter.1772.70 10.65 14.4%
cache inv. w/overlap 828.52 8.60 23.7%
1 iter. w/overlap1803.91 8.49 14.3%
10 iter. w/overlap1835.35 8.87 12.4%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 751.10 9.00 33.1%
1 iter.1557.17 8.91 35.4%
10 iter.1650.66 9.04 35.3%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 749.47 14.88 17.1%
1 iter.1658.02 14.67 18.6%
10 iter.1693.74 14.96 19.3%
cache inv. w/overlap 756.71 14.76 19.0%
1 iter. w/overlap1725.39 14.51 19.1%
10 iter. w/overlap1692.91 14.29 18.5%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 731.97 14.95 17.7%
1 iter.1559.89 15.38 18.3%
10 iter.1708.83 15.21 19.8%
cache inv. w/overlap 777.91 15.43 18.2%
1 iter. w/overlap1673.12 15.14 19.3%
10 iter. w/overlap1650.25 15.51 19.5%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 728.72 15.75 17.6%
1 iter.1634.59 16.12 20.1%
10 iter.1652.64 16.07 20.3%
cache inv. w/overlap 756.45 15.36 18.2%
1 iter. w/overlap1574.88 15.28 18.4%
10 iter. w/overlap1703.83 15.54 20.2%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 809.59 14.15 21.8%
1 iter.1593.13 14.46 17.6%
10 iter.1693.39 14.20 18.3%


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.5098e-02   1.4744e-05   17.36   0.55   0.34   1.21 
  256   7.9517e-03   1.5531e-05   32.97   0.52   0.31   1.16 
  512   3.9714e-03   1.5513e-05   66.01   0.57   0.41   1.25 
  1024   2.3089e-03   1.8038e-05   113.54   0.48   0.32   1.02 
  2048   1.3767e-03   2.1511e-05   190.41   0.41   0.29   0.85 
  4096   9.0545e-04   2.8295e-05   289.52   0.31   0.25   0.71 
  8192   7.5251e-04   4.7032e-05   348.36   0.22   0.26   0.28 
  16384   6.0147e-04   7.5183e-05   435.84   0.13   0.15   0.20 
  32768   5.3367e-04   1.3342e-04   491.21   0.06   0.06   0.11 
  65536   4.0347e-04   2.0173e-04   649.73   0.05   0.04   0.13 
  131072   3.3744e-04   3.3744e-04   776.86   0.03   0.03   0.08 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   2   1   3   6 
  1024   0   2   1   3   6 
  2048   0   2   1   3   6 
  4096   0   2   1   3   6 
  8192   4   5   0   10   8 
  16384   4   5   0   10   1 
  32768   4   5   2   0   10 
  65536   4   5   0   6   3 
  131072   1   4   5   3   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   3 
  256    1   1   4 
  512    1   1   3 
  1024    1   1   4 
  2048    1   1   5 
  4096    1   2   5 
  8192    1   1   5 
  16384    1   2   11 
  32768    1   5   11 
  65536    1   7   11 
  131072    1   9   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.4961e-02   1.4610e-05   17.52   0.55   0.35   1.22 
  256   7.7769e-03   1.5189e-05   33.71   0.51   0.30   1.15 
  512   3.5513e-03   1.3872e-05   73.82   0.64   0.48   1.38 
  1024   1.9348e-03   1.5116e-05   135.49   0.59   0.42   1.27 
  2048   1.0592e-03   1.6550e-05   247.49   0.53   0.38   1.11 
  4096   6.1732e-04   1.9291e-05   424.65   0.46   0.31   0.93 
  8192   5.0029e-04   3.1268e-05   523.98   0.27   0.28   0.40 
  16384   3.2909e-04   4.1137e-05   796.56   0.22   0.23   0.37 
  32768   2.6337e-04   6.5843e-05   995.33   0.10   0.11   0.16 
  65536   1.8040e-04   9.0200e-05   1453.13   0.10   0.11   0.16 
  131072   1.5431e-04   1.5431e-04   1698.85   0.06   0.06   0.12 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   2   1   3   6 
  1024   0   2   1   3   6 
  2048   0   2   1   3   6 
  4096   0   2   1   3   6 
  8192   4   5   10   0   8 
  16384   4   5   7   8   10 
  32768   4   5   7   10   1 
  65536   4   5   0   3   2 
  131072   5   4   10   1   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   4 
  256    1   1   4 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   3 
  4096    1   1   4 
  8192    1   1   3 
  16384    1   1   7 
  32768    2   2   11 
  65536    1   1   11 
  131072    1   5   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.4988e-02   1.4637e-05   17.49   0.54   0.35   1.22 
  256   7.7267e-03   1.5091e-05   33.93   0.52   0.31   1.17 
  512   3.5777e-03   1.3975e-05   73.27   0.64   0.45   1.38 
  1024   1.9677e-03   1.5372e-05   133.23   0.56   0.38   1.22 
  2048   1.0781e-03   1.6845e-05   243.16   0.50   0.34   1.09 
  4096   6.2192e-04   1.9435e-05   421.51   0.43   0.28   0.93 
  8192   4.8584e-04   3.0365e-05   539.57   0.30   0.34   0.43 
  16384   3.2100e-04   4.0125e-05   816.64   0.22   0.26   0.32 
  32768   2.4202e-04   6.0505e-05   1083.16   0.14   0.17   0.22 
  65536   1.7473e-04   8.7365e-05   1500.29   0.11   0.12   0.16 
  131072   1.4862e-04   1.4862e-04   1763.90   0.04   0.04   0.07 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   2   1   3   6 
  1024   0   2   1   3   6 
  2048   0   2   1   3   6 
  4096   0   2   1   3   6 
  8192   4   5   0   10   7 
  16384   4   5   10   0   1 
  32768   4   5   7   0   10 
  65536   4   5   10   0   7 
  131072   5   4   0   10   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   4 
  256    1   1   4 
  512    1   1   3 
  1024    1   1   3 
  2048    1   1   5 
  4096    1   1   4 
  8192    1   1   2 
  16384    1   1   5 
  32768    1   2   11 
  65536    1   2   11 
  131072    2   7   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.4900e-02   1.4551e-05   17.59   0.49   0.22   1.15 
  256   7.8829e-03   1.5396e-05   33.25   0.44   0.18   1.07 
  512   4.0245e-03   1.5721e-05   65.14   0.50   0.29   1.13 
  1024   2.2943e-03   1.7924e-05   114.26   0.43   0.22   0.98 
  2048   1.3360e-03   2.0876e-05   196.21   0.38   0.21   0.86 
  4096   8.8905e-04   2.7783e-05   294.86   0.28   0.15   0.62 
  8192   6.9356e-04   4.3348e-05   377.97   0.29   0.33   0.42 
  16384   5.5568e-04   6.9460e-05   471.75   0.20   0.22   0.30 
  32768   4.8893e-04   1.2223e-04   536.15   0.13   0.15   0.22 
  65536   3.8819e-04   1.9409e-04   675.30   0.07   0.08   0.12 
  131072   3.2180e-04   3.2180e-04   814.62   0.06   0.07   0.11 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   4   3   1 
  256   0   2   4   3   1 
  512   0   2   4   1   3 
  1024   0   2   4   1   3 
  2048   0   2   4   1   5 
  4096   0   4   1   2   5 
  8192   4   5   10   7   0 
  16384   4   5   10   0   1 
  32768   4   5   0   1   2 
  65536   4   5   0   2   9 
  131072   4   5   8   3   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   2   7 
  256    1   2   7 
  512    1   1   4 
  1024    1   1   6 
  2048    1   1   6 
  4096    1   1   7 
  8192    1   2   2 
  16384    1   1   7 
  32768    1   2   11 
  65536    2   3   11 
  131072    2   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.4851e-02   1.4503e-05   17.65   0.48   0.21   1.13 
  256   7.5443e-03   1.4735e-05   34.75   0.48   0.23   1.11 
  512   3.5932e-03   1.4036e-05   72.96   0.58   0.30   1.24 
  1024   2.0180e-03   1.5765e-05   129.90   0.47   0.25   1.09 
  2048   1.1079e-03   1.7312e-05   236.60   0.42   0.22   1.01 
  4096   6.0443e-04   1.8888e-05   433.71   0.45   0.27   0.96 
  8192   4.4215e-04   2.7634e-05   592.89   0.41   0.47   0.59 
  16384   3.1043e-04   3.8803e-05   844.46   0.27   0.31   0.41 
  32768   2.4176e-04   6.0440e-05   1084.32   0.20   0.25   0.30 
  65536   1.7041e-04   8.5207e-05   1538.28   0.16   0.19   0.24 
  131072   1.5080e-04   1.5080e-04   1738.36   0.09   0.09   0.17 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   4   6   1 
  256   0   2   4   1   3 
  512   0   2   4   6   3 
  1024   0   2   4   1   3 
  2048   0   2   4   1   6 
  4096   0   2   4   1   3 
  8192   4   5   0   10   7 
  16384   4   5   10   7   0 
  32768   4   5   0   10   1 
  65536   4   5   10   7   3 
  131072   4   5   9   10   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   7 
  256    1   1   7 
  512    1   1   3 
  1024    1   1   6 
  2048    1   3   7 
  4096    1   1   5 
  8192    1   1   2 
  16384    1   2   3 
  32768    1   2   7 
  65536    1   2   11 
  131072    2   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.4687e-02   1.4343e-05   17.85   0.51   0.27   1.19 
  256   7.6280e-03   1.4898e-05   34.37   0.48   0.25   1.13 
  512   3.6489e-03   1.4253e-05   71.84   0.56   0.33   1.25 
  1024   1.9922e-03   1.5564e-05   131.59   0.49   0.26   1.12 
  2048   1.0590e-03   1.6547e-05   247.53   0.47   0.26   1.08 
  4096   6.1244e-04   1.9139e-05   428.03   0.42   0.23   0.94 
  8192   4.2120e-04   2.6325e-05   622.38   0.46   0.50   0.64 
  16384   2.9058e-04   3.6322e-05   902.14   0.33   0.37   0.48 
  32768   2.2088e-04   5.5221e-05   1186.80   0.23   0.27   0.32 
  65536   1.6877e-04   8.4387e-05   1553.23   0.15   0.17   0.20 
  131072   1.3919e-04   1.3919e-04   1883.29   0.10   0.12   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   4   2   1   6 
  256   0   4   2   1   6 
  512   0   2   4   1   6 
  1024   0   4   2   1   6 
  2048   0   4   2   1   6 
  4096   0   2   4   1   6 
  8192   4   5   10   1   7 
  16384   4   5   10   0   7 
  32768   4   5   10   7   0 
  65536   4   5   0   7   1 
  131072   4   5   10   1   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   4 
  256    1   1   5 
  512    1   1   4 
  1024    1   1   5 
  2048    1   1   4 
  4096    1   1   6 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   3 
  65536    1   2   11 
  131072    1   2   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:32 EDT.
81139 accesses since 1/2/96.