COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 2MB message using MPI within an 8 processor LPAR node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 2, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 805.10 10.59 34.1%
1 iter. 856.39 10.69 34.6%
10 iter.1425.26 10.21 41.8%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 810.09 13.32 31.6%
1 iter. 843.36 13.58 30.8%
10 iter.1394.23 13.00 40.2%
cache inv. w/overlap 805.39 13.63 31.4%
1 iter. w/overlap 851.64 13.63 31.4%
10 iter. w/overlap1405.72 13.02 41.4%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 810.74 11.67 33.3%
1 iter. 854.02 11.84 32.4%
10 iter.1405.29 11.18 41.3%
cache inv. w/overlap 811.87 11.62 33.7%
1 iter. w/overlap 850.95 11.71 33.3%
10 iter. w/overlap1418.70 11.34 41.8%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 826.30 14.37 31.8%
1 iter. 836.23 14.24 30.1%
10 iter.1393.56 13.92 40.2%
cache inv. w/overlap 816.51 14.65 31.2%
1 iter. w/overlap 853.73 14.48 30.9%
10 iter. w/overlap1401.23 14.05 41.3%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 804.04 15.65 23.3%
1 iter. 841.16 16.03 21.7%
10 iter.1441.95 16.33 43.0%
cache inv. w/overlap 807.14 11.66 24.5%
1 iter. w/overlap 852.16 11.80 25.4%
10 iter. w/overlap1459.46 11.34 43.2%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 809.52 18.01 22.0%
1 iter. 847.75 18.10 22.0%
10 iter.1417.82 17.59 40.8%
cache inv. w/overlap 798.96 14.39 24.1%
1 iter. w/overlap 843.24 14.52 24.3%
10 iter. w/overlap1460.43 14.03 42.5%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 815.59 15.01 29.2%
1 iter. 840.59 14.94 28.2%
10 iter.1393.28 15.09 40.3%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 807.69 20.65 21.2%
1 iter. 839.06 20.62 20.1%
10 iter.1395.44 19.71 40.2%
cache inv. w/overlap 807.76 20.48 22.3%
1 iter. w/overlap 852.56 20.67 21.5%
10 iter. w/overlap1401.20 19.93 40.5%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 817.90 18.68 23.3%
1 iter. 840.70 18.62 21.7%
10 iter.1424.91 17.70 41.4%
cache inv. w/overlap 788.72 19.01 20.2%
1 iter. w/overlap 844.96 18.82 21.1%
10 iter. w/overlap1413.70 17.93 41.2%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 806.34 21.50 21.7%
1 iter. 843.08 21.56 20.1%
10 iter.1388.49 20.79 39.6%
cache inv. w/overlap 815.73 21.80 21.9%
1 iter. w/overlap 850.28 21.64 21.3%
10 iter. w/overlap1394.99 20.96 40.7%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 804.99 17.92 22.4%
1 iter. 853.59 17.83 21.7%
10 iter.1422.45 16.53 41.6%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.8860e-02   2.8183e-05   145.33   0.38   0.34   0.76 
  4096   1.8017e-02   3.5189e-05   232.80   0.30   0.26   0.60 
  8192   1.4933e-02   5.8331e-05   280.88   0.13   0.12   0.21 
  16384   1.1211e-02   8.7590e-05   374.11   0.08   0.07   0.13 
  32768   9.4098e-03   1.4703e-04   445.74   0.04   0.04   0.08 
  65536   7.5978e-03   2.3743e-04   552.04   0.02   0.02   0.05 
  131072   6.2623e-03   3.9139e-04   669.77   0.03   0.04   0.05 
  262144   5.6749e-03   7.0936e-04   739.09   0.03   0.03   0.05 
  524288   5.3738e-03   1.3435e-03   780.51   0.02   0.02   0.04 
  1048576   5.2257e-03   2.6129e-03   802.62   0.02   0.02   0.03 
  2097152   5.0786e-03   5.0786e-03   825.87   0.01   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   6   3 
  8192   4   10   0   5   8 
  16384   4   10   0   5   2 
  32768   4   0   5   10   2 
  65536   4   5   0   10   8 
  131072   4   5   0   6   10 
  262144   0   4   10   2   8 
  524288   5   10   3   7   0 
  1048576   6   1   7   4   8 
  2097152   10   9   7   4   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   5 
  8192    1   1   11 
  16384    1   2   11 
  32768    1   6   11 
  65536    3   11   11 
  131072    1   9   11 
  262144    2   11   11 
  524288    2   11   11 
  1048576    3   11   11 
  2097152    5   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.8629e-02   2.7958e-05   146.50   0.38   0.35   0.76 
  4096   1.7682e-02   3.4535e-05   237.21   0.30   0.26   0.61 
  8192   1.4637e-02   5.7177e-05   286.55   0.13   0.11   0.20 
  16384   1.0914e-02   8.5267e-05   384.30   0.08   0.07   0.12 
  32768   8.9873e-03   1.4043e-04   466.69   0.05   0.06   0.08 
  65536   7.1598e-03   2.2374e-04   585.81   0.04   0.05   0.06 
  131072   6.0795e-03   3.7997e-04   689.91   0.02   0.02   0.04 
  262144   5.5037e-03   6.8796e-04   762.09   0.01   0.02   0.04 
  524288   5.2014e-03   1.3003e-03   806.39   0.01   0.01   0.02 
  1048576   4.9863e-03   2.4932e-03   841.16   0.02   0.01   0.04 
  2097152   4.6500e-03   4.6500e-03   902.01   0.02   0.02   0.05 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   6   3 
  8192   4   10   0   8   5 
  16384   4   10   0   5   8 
  32768   4   10   0   5   8 
  65536   4   5   0   10   2 
  131072   4   0   10   5   2 
  262144   0   8   10   5   1 
  524288   9   3   7   0   5 
  1048576   4   0   10   3   6 
  2097152   3   10   2   6   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   2   5 
  8192    1   1   11 
  16384    1   3   11 
  32768    1   5   11 
  65536    1   7   11 
  131072    4   11   11 
  262144    4   11   11 
  524288    5   11   11 
  1048576    4   11   11 
  2097152    2   10   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.4001e-02   2.3438e-05   174.76   0.46   0.49   0.91 
  4096   1.3551e-02   2.6466e-05   309.53   0.41   0.40   0.81 
  8192   1.0774e-02   4.2085e-05   389.31   0.16   0.14   0.28 
  16384   6.8582e-03   5.3579e-05   611.58   0.14   0.11   0.23 
  32768   4.9905e-03   7.7977e-05   840.45   0.09   0.08   0.15 
  65536   3.6834e-03   1.1511e-04   1138.69   0.06   0.06   0.11 
  131072   3.1138e-03   1.9461e-04   1347.02   0.03   0.03   0.06 
  262144   2.9088e-03   3.6360e-04   1441.95   0.02   0.03   0.04 
  524288   3.5909e-03   8.9773e-04   1168.03   0.01   0.01   0.02 
  1048576   4.8397e-03   2.4198e-03   866.65   0.01   0.01   0.01 
  2097152   5.0204e-03   5.0204e-03   835.45   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   3   6 
  4096   0   2   1   3   6 
  8192   4   0   10   5   8 
  16384   4   0   10   5   2 
  32768   4   10   0   5   8 
  65536   4   0   10   5   2 
  131072   4   0   10   2   5 
  262144   4   0   8   10   5 
  524288   10   0   2   8   6 
  1048576   10   2   0   8   3 
  2097152   0   4   9   8   10 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   9 
  16384    1   1   11 
  32768    1   3   11 
  65536    1   5   11 
  131072    1   10   11 
  262144    1   11   11 
  524288    6   11   11 
  1048576    11   11   11 
  2097152    3   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.8671e-02   2.7999e-05   146.29   0.35   0.28   0.80 
  4096   1.7783e-02   3.4732e-05   235.86   0.29   0.24   0.64 
  8192   1.3135e-02   5.1310e-05   319.31   0.26   0.28   0.40 
  16384   1.0336e-02   8.0753e-05   405.78   0.16   0.16   0.24 
  32768   8.8643e-03   1.3851e-04   473.17   0.10   0.10   0.15 
  65536   7.2818e-03   2.2756e-04   576.00   0.06   0.07   0.09 
  131072   6.3000e-03   3.9375e-04   665.76   0.02   0.03   0.04 
  262144   5.7038e-03   7.1298e-04   735.35   0.02   0.02   0.04 
  524288   5.4133e-03   1.3533e-03   774.82   0.02   0.02   0.04 
  1048576   5.2511e-03   2.6255e-03   798.75   0.02   0.02   0.04 
  2097152   5.0566e-03   5.0566e-03   829.48   0.02   0.02   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   6 
  4096   0   4   2   1   6 
  8192   4   5   0   10   8 
  16384   4   5   10   0   8 
  32768   4   5   10   0   2 
  65536   4   5   0   10   2 
  131072   4   10   0   2   5 
  262144   5   0   8   2   4 
  524288   4   0   2   10   6 
  1048576   7   4   10   0   6 
  2097152   5   1   0   2   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   7 
  8192    1   1   4 
  16384    1   1   11 
  32768    1   1   11 
  65536    1   3   11 
  131072    1   11   11 
  262144    3   11   11 
  524288    2   11   11 
  1048576    3   11   11 
  2097152    3   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.8052e-02   2.7394e-05   149.52   0.36   0.30   0.82 
  4096   1.7457e-02   3.4095e-05   240.27   0.29   0.24   0.66 
  8192   1.2849e-02   5.0191e-05   326.43   0.27   0.28   0.39 
  16384   9.9025e-03   7.7363e-05   423.56   0.17   0.18   0.25 
  32768   8.6176e-03   1.3465e-04   486.71   0.09   0.09   0.14 
  65536   7.0626e-03   2.2071e-04   593.87   0.05   0.06   0.08 
  131072   5.9486e-03   3.7179e-04   705.09   0.04   0.04   0.06 
  262144   5.4847e-03   6.8558e-04   764.73   0.02   0.02   0.04 
  524288   5.2011e-03   1.3003e-03   806.43   0.01   0.01   0.04 
  1048576   4.9973e-03   2.4986e-03   839.32   0.01   0.01   0.03 
  2097152   4.7175e-03   4.7175e-03   889.09   0.01   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   4   2   1   6 
  4096   0   4   2   1   6 
  8192   4   5   10   0   2 
  16384   4   5   0   10   8 
  32768   4   5   0   10   8 
  65536   4   5   10   0   8 
  131072   4   5   10   0   6 
  262144   5   6   10   0   4 
  524288   8   2   4   5   7 
  1048576   5   7   0   4   9 
  2097152   10   0   3   2   4 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   7 
  8192    1   1   4 
  16384    1   1   10 
  32768    1   2   11 
  65536    1   5   11 
  131072    1   8   11 
  262144    3   11   11 
  524288    3   11   11 
  1048576    5   11   11 
  2097152    7   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.3933e-02   2.3372e-05   175.25   0.41   0.33   0.93 
  4096   1.3520e-02   2.6407e-05   310.22   0.36   0.30   0.83 
  8192   8.8740e-03   3.4664e-05   472.65   0.38   0.36   0.58 
  16384   5.9801e-03   4.6720e-05   701.37   0.29   0.30   0.43 
  32768   4.5244e-03   7.0693e-05   927.05   0.19   0.19   0.28 
  65536   3.4671e-03   1.0835e-04   1209.75   0.12   0.13   0.18 
  131072   2.9985e-03   1.8740e-04   1398.82   0.07   0.07   0.10 
  262144   2.8720e-03   3.5900e-04   1460.43   0.03   0.03   0.05 
  524288   3.5255e-03   8.8137e-04   1189.71   0.01   0.02   0.03 
  1048576   4.8349e-03   2.4174e-03   867.51   0.01   0.01   0.02 
  2097152   5.0532e-03   5.0532e-03   830.03   0.01   0.01   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   5 
  4096   0   2   4   1   5 
  8192   4   5   0   10   2 
  16384   4   5   0   10   2 
  32768   4   5   10   0   8 
  65536   4   5   10   0   2 
  131072   4   5   10   0   8 
  262144   5   4   10   0   2 
  524288   10   4   0   5   8 
  1048576   10   4   0   2   5 
  2097152   8   9   6   0   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   4 
  4096    1   1   4 
  8192    1   1   2 
  16384    1   1   3 
  32768    1   1   6 
  65536    1   2   11 
  131072    1   2   11 
  262144    2   11   11 
  524288    4   11   11 
  1048576    7   11   11 
  2097152    7   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:25 EDT.
81162 accesses since 1/2/96.