COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 2MB message using MPI within a node)

(performance measured per processor when all processors in an 8 processor LPAR node communicating with neighboring processor)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: i and i+1, i=0,2,4,...,30
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 839.24 12.06 25.9%
1 iter. 916.56 11.97 28.9%
10 iter.1925.46 13.23 50.3%
cache inv. w/overlap 846.52 12.14 26.9%
1 iter. w/overlap 890.80 12.21 27.2%
10 iter. w/overlap1912.52 13.31 50.7%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 847.04 10.85 25.8%
1 iter. 904.72 10.58 28.0%
10 iter.1881.91 11.41 50.1%
cache inv. w/overlap 853.79 10.46 27.3%
1 iter. w/overlap 893.64 10.42 27.4%
10 iter. w/overlap1863.19 10.02 51.6%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 823.88 14.34 41.3%
1 iter. 905.41 14.20 43.0%
10 iter.1602.68 14.49 46.7%
cache inv. w/overlap 840.84 14.22 40.7%
1 iter. w/overlap 921.22 14.19 41.8%
10 iter. w/overlap1842.61 12.75 49.7%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 841.95 19.20 6.5%
1 iter. 910.62 18.90 5.5%
10 iter.1945.74 19.30 49.9%
cache inv. w/overlap 848.23 10.97 2.7%
1 iter. w/overlap 910.36 11.11 2.1%
10 iter. w/overlap2285.11 10.40 57.6%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 834.65 23.08 9.9%
1 iter. 903.34 22.71 8.9%
10 iter.1897.04 23.69 48.8%
cache inv. w/overlap 854.68 14.40 7.1%
1 iter. w/overlap 911.72 14.00 7.9%
10 iter. w/overlap2195.26 13.22 56.2%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 859.66 11.38 25.1%
1 iter. 911.39 11.32 25.9%
10 iter.1939.00 9.45 51.7%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 853.25 29.81 14.6%
1 iter. 910.87 29.43 14.1%
10 iter.1921.73 25.88 50.1%
cache inv. w/overlap 832.76 29.80 16.2%
1 iter. w/overlap 904.26 28.90 13.1%
10 iter. w/overlap1912.97 25.32 49.8%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 842.04 28.53 19.0%
1 iter. 906.37 28.32 17.2%
10 iter.1894.84 25.51 48.5%
cache inv. w/overlap 835.65 28.30 16.7%
1 iter. w/overlap 906.91 27.64 15.9%
10 iter. w/overlap1867.87 25.10 48.1%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 851.57 28.71 27.6%
1 iter. 903.23 28.71 28.0%
10 iter.1617.67 28.04 46.5%
cache inv. w/overlap 847.34 26.98 28.6%
1 iter. w/overlap 905.82 26.85 28.3%
10 iter. w/overlap1873.57 26.54 51.4%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.5615e-02   1.5249e-05   268.60   0.57   0.52   1.35 
  4096   1.0061e-02   1.9651e-05   416.88   0.44   0.38   1.18 
  8192   9.3743e-03   3.6618e-05   447.43   0.21   0.11   0.59 
  16384   7.1657e-03   5.5982e-05   585.33   0.16   0.05   0.57 
  32768   6.0391e-03   9.4361e-05   694.52   0.14   0.03   0.56 
  65536   5.4185e-03   1.6933e-04   774.08   0.10   0.01   0.42 
  131072   5.2552e-03   3.2845e-04   798.12   0.10   0.09   0.24 
  262144   5.1065e-03   6.3832e-04   821.36   0.04   0.01   0.17 
  524288   5.0321e-03   1.2580e-03   833.51   0.03   0.01   0.12 
  1048576   4.9517e-03   2.4759e-03   847.04   0.02   0.01   0.07 
  2097152   5.0905e-03   5.0905e-03   823.95   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   6   1   3   4 
  4096   2   6   1   3   4 
  8192   4   5   8   6   2 
  16384   4   5   6   8   2 
  32768   4   6   8   2   5 
  65536   1   6   8   4   7 
  131072   7   5   4   1   2 
  262144   6   8   1   4   5 
  524288   4   6   8   5   2 
  1048576   2   7   4   6   8 
  2097152   2   5   4   7   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   4 
  4096    2   3   4 
  8192    1   1   7 
  16384    1   3   7 
  32768    3   7   7 
  65536    5   7   7 
  131072    4   4   9 
  262144    4   7   9 
  524288    2   7   9 
  1048576    5   7   9 
  2097152    4   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.5162e-02   1.4806e-05   276.64   0.59   0.53   1.38 
  4096   9.7427e-03   1.9029e-05   430.51   0.45   0.39   1.20 
  8192   9.0214e-03   3.5240e-05   464.93   0.22   0.13   0.61 
  16384   6.8447e-03   5.3474e-05   612.78   0.17   0.05   0.58 
  32768   5.6592e-03   8.8425e-05   741.15   0.16   0.03   0.61 
  65536   5.1185e-03   1.5995e-04   819.45   0.10   0.02   0.40 
  131072   4.9009e-03   3.0631e-04   855.82   0.11   0.11   0.25 
  262144   4.7580e-03   5.9476e-04   881.52   0.05   0.02   0.19 
  524288   4.6797e-03   1.1699e-03   896.27   0.04   0.02   0.12 
  1048576   4.6047e-03   2.3024e-03   910.87   0.02   0.01   0.06 
  2097152   4.4761e-03   4.4761e-03   937.04   0.02   0.01   0.07 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   6   1   3   4 
  4096   6   2   1   3   4 
  8192   4   5   6   8   2 
  16384   4   6   5   8   2 
  32768   4   6   5   2   8 
  65536   4   1   6   7   5 
  131072   4   1   5   7   2 
  262144   8   6   7   5   2 
  524288   5   1   8   7   2 
  1048576   7   6   2   5   4 
  2097152   7   9   4   5   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   4 
  4096    2   2   4 
  8192    1   1   7 
  16384    1   3   7 
  32768    1   5   7 
  65536    4   7   7 
  131072    4   4   9 
  262144    3   7   9 
  524288    4   7   9 
  1048576    5   8   9 
  2097152    3   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.1105e-02   1.0844e-05   377.71   0.87   0.87   1.79 
  4096   6.2647e-03   1.2236e-05   669.51   0.77   0.74   1.65 
  8192   6.0229e-03   2.3527e-05   696.39   0.37   0.36   0.61 
  16384   3.5919e-03   2.8062e-05   1167.70   0.28   0.20   0.65 
  32768   2.5133e-03   3.9270e-05   1668.87   0.24   0.13   0.68 
  65536   2.1556e-03   6.7364e-05   1945.74   0.11   0.03   0.43 
  131072   2.2647e-03   1.4154e-04   1852.05   0.05   0.03   0.16 
  262144   2.9644e-03   3.7055e-04   1414.88   0.01   0.01   0.02 
  524288   4.0734e-03   1.0183e-03   1029.69   0.01   0.01   0.03 
  1048576   4.3111e-03   2.1555e-03   972.91   0.04   0.01   0.15 
  2097152   4.3175e-03   4.3175e-03   971.47   0.04   0.02   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   6   2   8 
  65536   4   6   1   7   5 
  131072   4   5   7   1   6 
  262144   5   2   1   6   4 
  524288   4   5   1   6   2 
  1048576   4   5   8   7   1 
  2097152   2   5   4   7   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   2 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   5 
  32768    1   1   7 
  65536    2   7   7 
  131072    2   7   9 
  262144    5   9   9 
  524288    7   9   9 
  1048576    3   7   9 
  2097152    2   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.5434e-02   1.5072e-05   271.76   0.46   0.22   1.25 
  4096   1.0079e-02   1.9686e-05   416.14   0.34   0.14   1.07 
  8192   7.5860e-03   2.9633e-05   552.90   0.43   0.39   0.92 
  16384   6.3653e-03   4.9729e-05   658.93   0.29   0.20   0.75 
  32768   5.5572e-03   8.6831e-05   754.76   0.22   0.12   0.69 
  65536   5.2852e-03   1.6516e-04   793.60   0.12   0.06   0.39 
  131072   5.1751e-03   3.2344e-04   810.48   0.11   0.13   0.23 
  262144   5.0719e-03   6.3399e-04   826.97   0.05   0.04   0.15 
  524288   4.9897e-03   1.2474e-03   840.59   0.03   0.02   0.09 
  1048576   4.9548e-03   2.4774e-03   846.52   0.02   0.01   0.04 
  2097152   5.0381e-03   5.0381e-03   832.52   0.02   0.03   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   4   6   1   3 
  4096   2   6   4   1   5 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   8   6   2 
  65536   4   6   1   8   7 
  131072   4   5   7   1   8 
  262144   4   2   5   6   8 
  524288   5   6   2   4   7 
  1048576   1   5   8   4   9 
  2097152   6   9   8   1   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   3   6 
  4096    2   3   6 
  8192    1   1   2 
  16384    1   1   7 
  32768    1   2   7 
  65536    1   3   7 
  131072    1   4   9 
  262144    1   7   9 
  524288    2   8   9 
  1048576    2   9   9 
  2097152    2   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.5169e-02   1.4813e-05   276.51   0.46   0.21   1.25 
  4096   9.8347e-03   1.9208e-05   426.48   0.35   0.12   1.07 
  8192   7.2946e-03   2.8495e-05   574.99   0.44   0.39   0.93 
  16384   5.9910e-03   4.6805e-05   700.10   0.31   0.21   0.78 
  32768   5.3610e-03   8.3766e-05   782.37   0.22   0.11   0.68 
  65536   4.9429e-03   1.5447e-04   848.55   0.13   0.06   0.41 
  131072   4.7618e-03   2.9761e-04   880.83   0.13   0.16   0.27 
  262144   4.7584e-03   5.9480e-04   881.45   0.05   0.02   0.18 
  524288   4.6472e-03   1.1618e-03   902.54   0.04   0.01   0.09 
  1048576   4.6220e-03   2.3110e-03   907.47   0.01   0.01   0.03 
  2097152   4.5079e-03   4.5079e-03   930.42   0.03   0.01   0.12 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   6   4   1   5 
  4096   2   6   4   1   3 
  8192   4   5   8   6   2 
  16384   4   5   6   2   8 
  32768   4   6   8   2   1 
  65536   4   5   8   7   1 
  131072   5   4   1   7   2 
  262144   2   5   4   6   1 
  524288   5   4   6   8   7 
  1048576   6   7   5   3   8 
  2097152   5   7   6   9   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   3   6 
  4096    1   3   6 
  8192    1   1   2 
  16384    1   1   6 
  32768    1   1   7 
  65536    1   1   7 
  131072    1   3   7 
  262144    4   7   9 
  524288    2   5   9 
  1048576    4   9   9 
  2097152    6   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.1031e-02   1.0773e-05   380.22   0.64   0.32   1.65 
  4096   6.2813e-03   1.2268e-05   667.74   0.57   0.28   1.49 
  8192   4.0010e-03   1.5629e-05   1048.33   0.88   1.02   1.23 
  16384   2.6543e-03   2.0737e-05   1580.19   0.56   0.64   0.80 
  32768   2.0444e-03   3.1944e-05   2051.59   0.35   0.42   0.50 
  65536   1.8355e-03   5.7359e-05   2285.11   0.17   0.19   0.24 
  131072   2.1669e-03   1.3543e-04   1935.58   0.08   0.10   0.12 
  262144   2.8688e-03   3.5861e-04   1462.02   0.04   0.04   0.06 
  524288   4.0511e-03   1.0128e-03   1035.34   0.02   0.02   0.04 
  1048576   4.3233e-03   2.1616e-03   970.17   0.02   0.01   0.06 
  2097152   4.3512e-03   4.3512e-03   963.94   0.02   0.01   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   3 
  4096   6   2   4   1   3 
  8192   4   5   6   8   2 
  16384   4   5   6   8   2 
  32768   4   5   6   8   2 
  65536   4   5   6   7   1 
  131072   4   5   1   6   7 
  262144   4   5   7   6   2 
  524288   4   5   7   3   9 
  1048576   5   4   1   6   8 
  2097152   4   9   5   7   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   2   4 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   9 
  131072    1   2   9 
  262144    1   6   9 
  524288    3   9   9 
  1048576    3   8   9 
  2097152    5   8   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:22 EDT.
2802 accesses since 1/2/96.