COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 128KB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 16384 REAL*8 floating point values each direction
Message size: Largest - 16384 REAL*8 floating point values
Smallest - 16 REAL*8 floating point values
Processors: 0 and 16, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 644.89 9.10 44.3%
1 iter.1344.15 8.76 44.9%
10 iter.1522.55 8.49 48.4%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 628.46 10.42 38.5%
1 iter.1447.14 9.37 45.8%
10 iter.1539.29 9.82 44.1%
cache inv. w/overlap 607.06 10.50 41.6%
1 iter. w/overlap1418.12 10.26 45.4%
10 iter. w/overlap1507.90 10.53 42.8%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 637.30 9.60 42.1%
1 iter.1407.36 9.58 43.0%
10 iter.1518.28 9.60 44.4%
cache inv. w/overlap 647.34 10.39 43.5%
1 iter. w/overlap1341.76 9.86 45.7%
10 iter. w/overlap1528.48 10.13 44.0%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 645.48 10.90 42.8%
1 iter.1411.70 10.66 43.4%
10 iter.1523.19 10.73 42.0%
cache inv. w/overlap 624.01 11.44 38.5%
1 iter. w/overlap1411.60 11.21 43.2%
10 iter. w/overlap1528.93 11.46 40.5%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 651.11 12.18 22.3%
1 iter.1481.82 12.20 13.8%
10 iter.1696.78 11.77 15.2%
cache inv. w/overlap 644.12 10.99 20.6%
1 iter. w/overlap1560.70 10.70 12.7%
10 iter. w/overlap1800.41 10.53 19.2%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 636.29 12.82 21.9%
1 iter.1471.90 13.14 14.8%
10 iter.1681.47 12.92 16.6%
cache inv. w/overlap 665.36 11.48 24.2%
1 iter. w/overlap1497.97 11.28 14.0%
10 iter. w/overlap1767.70 11.31 15.3%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 638.34 10.12 43.0%
1 iter.1349.59 10.41 45.5%
10 iter.1483.14 10.27 45.2%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 627.18 19.42 16.5%
1 iter.1358.26 19.66 20.4%
10 iter.1510.95 19.23 22.2%
cache inv. w/overlap 619.79 20.86 17.5%
1 iter. w/overlap1388.97 19.83 21.0%
10 iter. w/overlap1518.77 19.61 22.7%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 625.79 19.00 19.2%
1 iter.1424.24 19.35 21.0%
10 iter.1520.55 19.25 22.3%
cache inv. w/overlap 634.53 21.03 16.6%
1 iter. w/overlap1365.62 20.62 21.5%
10 iter. w/overlap1508.25 20.57 23.7%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 618.22 21.32 15.6%
1 iter.1355.54 20.47 21.2%
10 iter.1528.59 20.61 24.0%
cache inv. w/overlap 627.04 21.19 16.4%
1 iter. w/overlap1435.09 20.98 23.0%
10 iter. w/overlap1516.15 20.61 23.8%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 621.27 19.29 17.5%
1 iter.1478.03 18.57 20.9%
10 iter.1522.58 18.67 21.7%


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.8605e-02   1.8169e-05   14.09   0.56   0.37   1.34 
  256   9.2862e-03   1.8137e-05   28.23   0.59   0.39   1.33 
  512   5.1054e-03   1.9943e-05   51.35   0.55   0.34   1.26 
  1024   2.8480e-03   2.2250e-05   92.04   0.49   0.33   1.11 
  2048   1.7130e-03   2.6766e-05   153.03   0.39   0.29   0.88 
  4096   1.3419e-03   4.1936e-05   195.35   0.30   0.32   0.44 
  8192   9.3794e-04   5.8621e-05   279.49   0.22   0.26   0.33 
  16384   7.5240e-04   9.4050e-05   348.41   0.11   0.12   0.18 
  32768   6.4397e-04   1.6099e-04   407.08   0.07   0.08   0.10 
  65536   5.0008e-04   2.5004e-04   524.20   0.04   0.04   0.08 
  131072   4.0805e-04   4.0805e-04   642.43   0.04   0.04   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   2   1   3   6 
  1024   0   2   1   3   6 
  2048   0   2   1   6   3 
  4096   4   5   1   2   10 
  8192   4   5   2   10   1 
  16384   5   4   2   7   0 
  32768   4   5   0   7   3 
  65536   4   0   5   10   2 
  131072   0   4   10   5   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   5 
  1024    1   1   5 
  2048    1   1   5 
  4096    1   1   2 
  8192    1   1   5 
  16384    2   2   11 
  32768    1   3   11 
  65536    2   7   11 
  131072    1   8   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.7989e-02   1.7567e-05   14.57   0.58   0.38   1.35 
  256   9.0148e-03   1.7607e-05   29.08   0.59   0.37   1.37 
  512   4.6771e-03   1.8270e-05   56.05   0.58   0.39   1.30 
  1024   2.5175e-03   1.9668e-05   104.13   0.53   0.30   1.32 
  2048   1.3750e-03   2.1484e-05   190.66   0.47   0.28   1.07 
  4096   9.5423e-04   2.9820e-05   274.72   0.45   0.51   0.66 
  8192   6.2001e-04   3.8750e-05   422.81   0.29   0.35   0.39 
  16384   4.1294e-04   5.1618e-05   634.82   0.24   0.29   0.33 
  32768   3.0663e-04   7.6657e-05   854.93   0.17   0.21   0.24 
  65536   2.2101e-04   1.1051e-04   1186.10   0.12   0.13   0.16 
  131072   1.9193e-04   1.9193e-04   1365.85   0.07   0.07   0.16 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   6   1   3 
  512   0   2   1   6   3 
  1024   0   2   1   6   3 
  2048   0   2   1   6   3 
  4096   4   5   0   10   2 
  8192   4   5   10   0   1 
  16384   4   5   10   0   2 
  32768   4   5   0   10   1 
  65536   5   4   0   9   2 
  131072   0   5   7   4   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   5 
  1024    1   1   5 
  2048    1   1   5 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   2   4 
  32768    1   1   11 
  65536    1   2   11 
  131072    2   5   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.7715e-02   1.7300e-05   14.80   0.61   0.37   1.40 
  256   9.0239e-03   1.7625e-05   29.05   0.59   0.36   1.38 
  512   4.6810e-03   1.8285e-05   56.00   0.56   0.35   1.30 
  1024   2.3967e-03   1.8724e-05   109.38   0.56   0.35   1.31 
  2048   1.3027e-03   2.0355e-05   201.23   0.51   0.34   1.17 
  4096   9.6370e-04   3.0116e-05   272.02   0.42   0.48   0.58 
  8192   5.8030e-04   3.6269e-05   451.74   0.32   0.37   0.47 
  16384   3.7253e-04   4.6566e-05   703.69   0.26   0.29   0.36 
  32768   2.7289e-04   6.8223e-05   960.61   0.19   0.22   0.28 
  65536   1.9301e-04   9.6503e-05   1358.22   0.12   0.14   0.19 
  131072   1.5470e-04   1.5470e-04   1694.55   0.10   0.12   0.15 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   3 
  256   0   2   1   6   3 
  512   0   2   1   6   3 
  1024   0   2   1   6   3 
  2048   0   2   1   3   6 
  4096   4   5   10   0   2 
  8192   4   5   0   10   1 
  16384   4   5   0   2   10 
  32768   4   5   0   2   7 
  65536   4   5   0   7   10 
  131072   4   5   0   10   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   4 
  256    1   1   5 
  512    1   1   5 
  1024    1   1   5 
  2048    1   1   5 
  4096    1   1   2 
  8192    1   2   2 
  16384    1   2   2 
  32768    1   2   9 
  65536    2   2   11 
  131072    1   2   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.9175e-02   1.8726e-05   13.67   0.55   0.25   1.30 
  256   9.7640e-03   1.9070e-05   26.85   0.53   0.25   1.29 
  512   5.2941e-03   2.0680e-05   49.52   0.50   0.22   1.24 
  1024   2.9470e-03   2.3023e-05   88.95   0.45   0.20   1.08 
  2048   1.7470e-03   2.7296e-05   150.06   0.36   0.16   0.86 
  4096   1.2399e-03   3.8747e-05   211.42   0.41   0.49   0.56 
  8192   9.1003e-04   5.6877e-05   288.06   0.26   0.30   0.34 
  16384   7.1299e-04   8.9124e-05   367.67   0.18   0.21   0.26 
  32768   6.2299e-04   1.5575e-04   420.79   0.11   0.12   0.15 
  65536   4.8900e-04   2.4450e-04   536.09   0.06   0.06   0.11 
  131072   3.8803e-04   3.8803e-04   675.58   0.09   0.11   0.15 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   1   6   4 
  256   0   2   4   6   1 
  512   0   2   4   1   6 
  1024   0   2   4   1   6 
  2048   0   2   1   4   6 
  4096   4   5   10   0   7 
  8192   4   5   10   9   8 
  16384   4   5   10   2   8 
  32768   4   5   10   2   0 
  65536   4   5   8   3   0 
  131072   4   5   10   6   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   6 
  256    1   1   6 
  512    1   1   7 
  1024    1   1   7 
  2048    1   1   7 
  4096    1   2   2 
  8192    2   2   2 
  16384    1   2   9 
  32768    1   2   11 
  65536    1   5   11 
  131072    1   1   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.8533e-02   1.8099e-05   14.14   0.57   0.27   1.34 
  256   9.5630e-03   1.8678e-05   27.41   0.54   0.25   1.28 
  512   4.8730e-03   1.9035e-05   53.79   0.53   0.24   1.28 
  1024   2.5727e-03   2.0099e-05   101.89   0.49   0.22   1.21 
  2048   1.3371e-03   2.0891e-05   196.06   0.51   0.24   1.19 
  4096   9.0802e-04   2.8376e-05   288.70   0.57   0.68   0.75 
  8192   5.4204e-04   3.3878e-05   483.62   0.48   0.56   0.65 
  16384   3.6183e-04   4.5228e-05   724.50   0.40   0.46   0.56 
  32768   2.8706e-04   7.1764e-05   913.22   0.24   0.26   0.37 
  65536   2.2069e-04   1.1035e-04   1187.82   0.12   0.15   0.21 
  131072   1.9205e-04   1.9205e-04   1365.01   0.12   0.15   0.21 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   6   1   4 
  256   0   2   4   6   1 
  512   0   2   4   1   6 
  1024   0   2   4   6   1 
  2048   0   2   1   4   5 
  4096   4   5   10   8   0 
  8192   4   5   0   10   8 
  16384   4   5   10   8   1 
  32768   4   5   2   0   6 
  65536   4   5   0   7   10 
  131072   4   5   7   10   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   6 
  1024    1   1   7 
  2048    1   1   6 
  4096    1   2   2 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   3 
  65536    2   2   11 
  131072    2   3   11 


Protocol Sensitivity Summary for Unidirectional Swap of 131072 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  128   1.8568e-02   1.8133e-05   14.12   0.56   0.27   1.30 
  256   9.4499e-03   1.8457e-05   27.74   0.54   0.26   1.29 
  512   4.8926e-03   1.9112e-05   53.58   0.52   0.24   1.25 
  1024   2.5651e-03   2.0040e-05   102.20   0.48   0.21   1.20 
  2048   1.3762e-03   2.1503e-05   190.48   0.44   0.18   1.10 
  4096   8.5150e-04   2.6609e-05   307.86   0.62   0.72   0.87 
  8192   5.2060e-04   3.2537e-05   503.54   0.49   0.58   0.67 
  16384   3.6069e-04   4.5086e-05   726.78   0.32   0.37   0.42 
  32768   2.6370e-04   6.5926e-05   994.09   0.24   0.28   0.32 
  65536   1.8500e-04   9.2500e-05   1416.99   0.17   0.20   0.22 
  131072   1.4549e-04   1.4549e-04   1801.74   0.16   0.19   0.23 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  128   0   2   4   1   6 
  256   0   2   4   1   6 
  512   0   2   4   1   6 
  1024   0   2   4   1   6 
  2048   0   2   4   1   6 
  4096   4   5   10   0   7 
  8192   4   5   10   0   2 
  16384   5   4   0   10   1 
  32768   4   5   10   8   7 
  65536   4   5   10   0   7 
  131072   4   5   0   9   2 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  128    1   1   5 
  256    1   1   5 
  512    1   1   6 
  1024    1   1   7 
  2048    1   1   7 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   1   2 
  32768    2   2   2 
  65536    1   2   11 
  131072    1   2   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:22:28 EDT.
86502 accesses since 1/2/96.