COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 2MB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 923.00 20.37 17.1%
1 iter. 942.30 20.23 16.5%
10 iter.1744.81 20.09 42.5%
cache inv. w/overlap 915.93 20.96 15.5%
1 iter. w/overlap 954.00 20.85 16.6%
10 iter. w/overlap1769.07 20.53 43.0%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 829.54 20.02 19.0%
1 iter. 918.21 20.14 13.1%
10 iter.1753.62 19.35 42.8%
cache inv. w/overlap 844.59 19.59 9.8%
1 iter. w/overlap 920.44 20.14 14.5%
10 iter. w/overlap1737.87 19.79 46.9%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 811.92 21.80 31.4%
1 iter. 872.71 21.95 31.2%
10 iter.1561.01 21.43 44.5%
cache inv. w/overlap 816.69 22.46 25.8%
1 iter. w/overlap 933.56 22.35 32.1%
10 iter. w/overlap1743.16 21.78 43.0%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 926.06 37.00 5.9%
1 iter. 962.58 36.67 6.0%
10 iter.1689.31 36.07 39.9%
cache inv. w/overlap 938.08 20.13 5.9%
1 iter. w/overlap 964.02 20.19 7.2%
10 iter. w/overlap1852.81 19.71 45.3%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 920.50 39.21 5.7%
1 iter. 951.05 38.81 6.2%
10 iter.1675.22 38.25 39.1%
cache inv. w/overlap 925.37 22.48 5.8%
1 iter. w/overlap 956.36 21.94 4.7%
10 iter. w/overlap1840.69 21.76 44.8%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 837.72 17.97 20.3%
1 iter. 896.92 17.85 21.4%
10 iter.1750.74 17.56 43.0%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 905.51 33.00 11.4%
1 iter. 954.93 33.68 12.2%
10 iter.1746.61 32.47 42.0%
cache inv. w/overlap 910.87 33.03 10.1%
1 iter. w/overlap 967.01 33.67 10.5%
10 iter. w/overlap1759.76 32.82 42.1%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 827.51 28.05 12.9%
1 iter. 878.67 28.02 16.4%
10 iter.1762.43 28.41 42.9%
cache inv. w/overlap 829.59 27.32 12.4%
1 iter. w/overlap 951.07 28.21 19.3%
10 iter. w/overlap1744.23 28.62 44.1%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 805.01 34.02 21.5%
1 iter. 830.18 34.43 20.0%
10 iter.1553.67 31.46 43.9%
cache inv. w/overlap 814.16 33.92 17.3%
1 iter. w/overlap 856.82 34.65 17.9%
10 iter. w/overlap1737.32 31.20 43.1%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2407e-02   2.1882e-05   187.19   0.44   0.44   0.95 
  4096   1.3208e-02   2.5796e-05   317.57   0.35   0.35   0.78 
  8192   1.0658e-02   4.1632e-05   393.54   0.19   0.10   0.47 
  16384   7.5405e-03   5.8910e-05   556.24   0.17   0.07   0.51 
  32768   6.0478e-03   9.4497e-05   693.52   0.15   0.05   0.56 
  65536   5.4243e-03   1.6951e-04   773.24   0.16   0.03   0.36 
  131072   4.9763e-03   3.1102e-04   842.86   0.15   0.18   0.29 
  262144   4.7466e-03   5.9332e-04   883.64   0.08   0.07   0.22 
  524288   4.5827e-03   1.1457e-03   915.24   0.10   0.09   0.23 
  1048576   4.6929e-03   2.3465e-03   893.75   0.07   0.08   0.15 
  2097152   4.5200e-03   4.5200e-03   927.95   0.08   0.13   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   8 
  4096   6   2   1   3   8 
  8192   6   2   8   7   1 
  16384   6   8   2   1   7 
  32768   6   8   1   2   7 
  65536   1   7   4   8   5 
  131072   7   1   5   4   8 
  262144   7   1   4   5   2 
  524288   1   5   4   7   6 
  1048576   5   4   1   7   8 
  2097152   7   4   5   1   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   3   6 
  16384    1   3   7 
  32768    1   5   7 
  65536    1   5   5 
  131072    1   2   7 
  262144    1   4   9 
  524288    1   4   9 
  1048576    4   4   9 
  2097152    1   3   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2345e-02   2.1821e-05   187.71   0.43   0.44   0.94 
  4096   1.3206e-02   2.5794e-05   317.60   0.34   0.34   0.78 
  8192   1.0415e-02   4.0685e-05   402.70   0.20   0.12   0.45 
  16384   7.3885e-03   5.7723e-05   567.68   0.16   0.07   0.49 
  32768   5.9118e-03   9.2372e-05   709.48   0.14   0.03   0.53 
  65536   5.0132e-03   1.5666e-04   836.65   0.20   0.09   0.41 
  131072   4.8498e-03   3.0311e-04   864.85   0.12   0.16   0.25 
  262144   4.5679e-03   5.7099e-04   918.21   0.06   0.02   0.21 
  524288   4.4894e-03   1.1223e-03   934.27   0.05   0.05   0.19 
  1048576   4.4059e-03   2.2030e-03   951.97   0.08   0.11   0.17 
  2097152   4.2367e-03   4.2367e-03   990.00   0.09   0.11   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   8 
  4096   6   2   1   3   8 
  8192   6   8   2   1   7 
  16384   6   2   8   1   7 
  32768   2   6   8   1   7 
  65536   2   1   7   4   5 
  131072   1   4   7   5   2 
  262144   2   1   5   7   6 
  524288   1   7   4   5   2 
  1048576   4   7   5   1   6 
  2097152   5   7   4   1   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   2   6 
  16384    2   3   7 
  32768    3   5   7 
  65536    1   2   5 
  131072    1   4   9 
  262144    2   6   9 
  524288    3   5   9 
  1048576    3   4   9 
  2097152    1   3   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.9620e-02   1.9160e-05   213.77   0.50   0.52   1.08 
  4096   1.0629e-02   2.0759e-05   394.62   0.45   0.43   0.99 
  8192   7.9044e-03   3.0876e-05   530.63   0.18   0.16   0.45 
  16384   4.7601e-03   3.7188e-05   881.14   0.18   0.14   0.37 
  32768   3.1843e-03   4.9754e-05   1317.20   0.22   0.11   0.58 
  65536   2.5151e-03   7.8597e-05   1667.64   0.14   0.06   0.42 
  131072   2.4038e-03   1.5024e-04   1744.83   0.07   0.02   0.21 
  262144   2.3798e-03   2.9748e-04   1762.43   0.04   0.01   0.13 
  524288   2.9517e-03   7.3793e-04   1420.97   0.01   0.01   0.03 
  1048576   3.9276e-03   1.9638e-03   1067.91   0.01   0.01   0.04 
  2097152   4.1476e-03   4.1476e-03   1011.27   0.05   0.02   0.18 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   8 
  4096   6   2   1   3   8 
  8192   6   2   8   9   1 
  16384   6   2   8   7   1 
  32768   6   2   8   1   7 
  65536   6   8   2   1   7 
  131072   7   1   6   2   8 
  262144   8   2   6   7   1 
  524288   6   1   7   8   2 
  1048576   7   1   6   4   5 
  2097152   7   5   1   4   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   1   7 
  16384    1   2   5 
  32768    1   3   6 
  65536    1   3   7 
  131072    3   5   9 
  262144    4   6   9 
  524288    5   9   9 
  1048576    5   9   9 
  2097152    3   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2352e-02   2.1828e-05   187.65   0.28   0.19   0.68 
  4096   1.3290e-02   2.5956e-05   315.61   0.22   0.14   0.52 
  8192   9.0854e-03   3.5490e-05   461.65   0.25   0.23   0.53 
  16384   6.7066e-03   5.2395e-05   625.40   0.23   0.17   0.59 
  32768   5.6456e-03   8.8213e-05   742.93   0.18   0.09   0.57 
  65536   5.0340e-03   1.5731e-04   833.20   0.18   0.08   0.46 
  131072   4.8620e-03   3.0388e-04   862.66   0.14   0.17   0.26 
  262144   4.7592e-03   5.9490e-04   881.30   0.06   0.04   0.18 
  524288   4.5956e-03   1.1489e-03   912.68   0.09   0.09   0.18 
  1048576   4.5513e-03   2.2756e-03   921.57   0.08   0.13   0.18 
  2097152   4.4868e-03   4.4868e-03   934.80   0.08   0.12   0.15 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   3 
  4096   6   4   2   1   3 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   6   8   2 
  65536   4   5   1   7   2 
  131072   4   5   7   1   2 
  262144   1   4   5   7   2 
  524288   5   4   1   7   2 
  1048576   4   5   1   7   8 
  2097152   5   4   1   7   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   5 
  16384    1   1   7 
  32768    1   2   7 
  65536    1   2   6 
  131072    1   3   8 
  262144    3   5   9 
  524288    1   4   9 
  1048576    3   4   9 
  2097152    2   4   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2071e-02   2.1554e-05   190.04   0.29   0.19   0.70 
  4096   1.2885e-02   2.5165e-05   325.53   0.23   0.17   0.53 
  8192   8.8755e-03   3.4670e-05   472.57   0.27   0.24   0.52 
  16384   6.6109e-03   5.1648e-05   634.45   0.21   0.14   0.54 
  32768   5.3837e-03   8.4121e-05   779.07   0.20   0.12   0.62 
  65536   4.8377e-03   1.5118e-04   867.00   0.22   0.24   0.43 
  131072   4.7213e-03   2.9508e-04   888.38   0.13   0.20   0.25 
  262144   4.5358e-03   5.6698e-04   924.70   0.06   0.04   0.20 
  524288   4.4779e-03   1.1195e-03   936.66   0.05   0.04   0.12 
  1048576   4.3508e-03   2.1754e-03   964.02   0.07   0.03   0.13 
  2097152   4.1483e-03   4.1483e-03   1011.08   0.11   0.13   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   4   2   1   5 
  4096   6   4   2   1   5 
  8192   4   5   6   2   8 
  16384   4   5   2   8   6 
  32768   4   5   8   6   7 
  65536   4   5   7   1   2 
  131072   4   5   1   7   8 
  262144   4   5   1   7   6 
  524288   4   5   1   2   7 
  1048576   4   5   1   3   7 
  2097152   5   4   7   8   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   5 
  16384    1   1   7 
  32768    1   1   7 
  65536    1   2   5 
  131072    2   4   9 
  262144    1   7   9 
  524288    2   6   9 
  1048576    2   5   9 
  2097152    1   2   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.9831e-02   1.9366e-05   211.50   0.30   0.21   0.73 
  4096   1.0725e-02   2.0946e-05   391.09   0.27   0.19   0.68 
  8192   6.6387e-03   2.5932e-05   631.79   0.26   0.26   0.40 
  16384   4.1155e-03   3.2153e-05   1019.14   0.22   0.22   0.33 
  32768   2.8691e-03   4.4830e-05   1461.87   0.16   0.16   0.24 
  65536   2.3371e-03   7.3036e-05   1794.63   0.10   0.10   0.16 
  131072   2.2638e-03   1.4148e-04   1852.81   0.06   0.07   0.13 
  262144   2.3115e-03   2.8894e-04   1814.54   0.03   0.04   0.04 
  524288   2.8707e-03   7.1768e-04   1461.06   0.02   0.02   0.04 
  1048576   3.8807e-03   1.9404e-03   1080.80   0.02   0.02   0.04 
  2097152   4.1271e-03   4.1271e-03   1016.28   0.03   0.02   0.10 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   4   2   1   5 
  4096   6   2   4   1   5 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   6   2   8 
  65536   4   5   6   8   2 
  131072   4   5   1   7   2 
  262144   4   6   5   1   7 
  524288   4   5   7   1   9 
  1048576   4   1   7   5   9 
  2097152   4   5   7   1   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   3 
  16384    1   1   5 
  32768    1   2   9 
  65536    1   2   9 
  131072    2   3   9 
  262144    1   9   9 
  524288    1   9   9 
  1048576    4   9   9 
  2097152    3   7   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:31 EDT.
80887 accesses since 1/2/96.