COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(unordered swap of 2MB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1378.16 11.57 37.0%
1 iter.1398.49 12.00 36.1%
10 iter.2227.75 12.86 37.4%
cache inv. w/overlap1379.48 12.05 36.2%
1 iter. w/overlap1383.80 12.12 36.7%
10 iter. w/overlap2257.96 12.68 38.0%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1375.35 10.46 36.3%
1 iter.1388.85 10.77 35.3%
10 iter.2207.75 10.89 40.0%
cache inv. w/overlap1371.79 10.12 37.8%
1 iter. w/overlap1401.68 10.49 36.9%
10 iter. w/overlap2239.34 9.11 46.0%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1377.74 14.66 46.8%
1 iter.1409.02 14.45 47.4%
10 iter.1849.69 14.01 37.4%
cache inv. w/overlap1363.93 14.41 44.5%
1 iter. w/overlap1376.37 13.80 45.9%
10 iter. w/overlap2188.01 12.19 41.6%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1353.66 17.49 3.5%
1 iter.1411.73 17.42 3.7%
10 iter.2281.69 17.45 36.5%
cache inv. w/overlap1399.58 10.61 3.4%
1 iter. w/overlap1415.52 10.24 5.1%
10 iter. w/overlap2636.49 9.28 44.2%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1370.68 22.08 3.4%
1 iter.1385.06 22.36 5.1%
10 iter.2261.19 23.18 35.3%
cache inv. w/overlap1379.36 14.50 5.1%
1 iter. w/overlap1393.19 14.04 3.6%
10 iter. w/overlap2523.45 12.14 42.4%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1371.06 10.45 36.5%
1 iter.1417.66 10.60 35.7%
10 iter.2232.17 8.15 47.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1369.70 27.68 6.2%
1 iter.1396.87 27.45 6.5%
10 iter.2214.72 24.09 36.1%
cache inv. w/overlap1375.12 27.64 7.5%
1 iter. w/overlap1413.45 27.26 5.3%
10 iter. w/overlap2237.26 23.22 34.8%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1367.27 26.29 7.9%
1 iter.1388.69 26.70 8.9%
10 iter.2210.13 24.10 34.3%
cache inv. w/overlap1385.04 26.23 6.4%
1 iter. w/overlap1386.55 25.31 5.8%
10 iter. w/overlap2218.13 24.32 34.3%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1382.56 27.16 34.2%
1 iter.1402.40 27.56 32.7%
10 iter.1844.69 28.24 35.4%
cache inv. w/overlap1373.23 25.82 34.2%
1 iter. w/overlap1423.05 25.59 34.5%
10 iter. w/overlap2164.03 25.59 37.5%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.3766e-02   1.3443e-05   304.69   0.64   0.53   1.46 
  4096   8.4121e-03   1.6430e-05   498.61   0.55   0.44   1.38 
  8192   7.7642e-03   3.0329e-05   540.21   0.26   0.17   0.65 
  16384   5.3988e-03   4.2178e-05   776.89   0.24   0.13   0.70 
  32768   4.3705e-03   6.8290e-05   959.68   0.17   0.03   0.66 
  65536   3.6733e-03   1.1479e-04   1141.84   0.12   0.02   0.49 
  131072   3.3382e-03   2.0864e-04   1256.46   0.11   0.02   0.36 
  262144   3.1741e-03   3.9676e-04   1321.43   0.06   0.02   0.22 
  524288   3.1045e-03   7.7612e-04   1351.04   0.01   0.01   0.04 
  1048576   3.0496e-03   1.5248e-03   1375.35   0.01   0.02   0.02 
  2097152   3.0300e-03   3.0300e-03   1384.27   0.01   0.00   0.02 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   6   1   3   4 
  4096   2   6   1   3   4 
  8192   4   5   2   6   8 
  16384   4   5   2   6   8 
  32768   4   6   2   5   8 
  65536   1   4   5   6   7 
  131072   4   6   7   5   1 
  262144   2   6   8   5   1 
  524288   8   7   2   5   9 
  1048576   2   8   7   9   3 
  2097152   6   4   9   1   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   3 
  4096    1   2   4 
  8192    1   1   7 
  16384    1   1   7 
  32768    1   5   7 
  65536    3   7   7 
  131072    3   6   7 
  262144    2   7   9 
  524288    3   9   9 
  1048576    3   9   9 
  2097152    8   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.3839e-02   1.3514e-05   303.09   0.63   0.52   1.45 
  4096   8.3225e-03   1.6255e-05   503.97   0.55   0.46   1.38 
  8192   7.6129e-03   2.9738e-05   550.95   0.27   0.19   0.67 
  16384   5.3987e-03   4.2178e-05   776.90   0.22   0.12   0.68 
  32768   4.1905e-03   6.5477e-05   1000.90   0.21   0.08   0.71 
  65536   3.5897e-03   1.1218e-04   1168.43   0.12   0.02   0.46 
  131072   3.2732e-03   2.0457e-04   1281.41   0.07   0.02   0.27 
  262144   3.1437e-03   3.9296e-04   1334.19   0.03   0.01   0.12 
  524288   3.0161e-03   7.5403e-04   1390.64   0.04   0.01   0.21 
  1048576   2.9986e-03   1.4993e-03   1398.77   0.00   0.01   0.01 
  2097152   2.9239e-03   2.9239e-03   1434.47   0.01   0.01   0.04 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   6   1   3   4 
  4096   2   6   1   3   4 
  8192   4   5   6   2   8 
  16384   4   5   6   2   8 
  32768   4   5   6   8   2 
  65536   4   7   6   8   1 
  131072   7   1   5   4   6 
  262144   2   6   8   5   4 
  524288   9   6   2   5   1 
  1048576   4   1   9   7   6 
  2097152   4   5   7   6   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   2   4 
  4096    1   2   4 
  8192    1   1   6 
  16384    1   2   7 
  32768    1   1   7 
  65536    1   7   7 
  131072    2   7   7 
  262144    4   7   9 
  524288    3   7   9 
  1048576    9   9   9 
  2097152    4   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   9.8000e-03   9.5703e-06   427.99   1.03   0.97   2.09 
  4096   5.6259e-03   1.0988e-05   745.54   0.89   0.84   1.81 
  8192   5.7607e-03   2.2503e-05   728.09   0.37   0.36   0.62 
  16384   3.4440e-03   2.6906e-05   1217.85   0.28   0.20   0.63 
  32768   2.3460e-03   3.6657e-05   1787.82   0.26   0.16   0.70 
  65536   1.9243e-03   6.0135e-05   2179.63   0.13   0.03   0.49 
  131072   1.8382e-03   1.1489e-04   2281.69   0.07   0.03   0.24 
  262144   2.1920e-03   2.7400e-04   1913.44   0.03   0.01   0.10 
  524288   2.7606e-03   6.9014e-04   1519.36   0.03   0.01   0.12 
  1048576   2.8636e-03   1.4318e-03   1464.69   0.06   0.01   0.22 
  2097152   2.9020e-03   2.9020e-03   1445.34   0.04   0.01   0.18 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   1   3   4 
  4096   6   2   1   3   4 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   6   2   8 
  65536   4   1   7   5   2 
  131072   4   5   6   1   7 
  262144   2   8   1   6   7 
  524288   4   2   8   6   5 
  1048576   4   8   5   2   7 
  2097152   5   7   1   4   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   2 
  4096    1   1   2 
  8192    1   1   2 
  16384    1   1   5 
  32768    1   1   7 
  65536    1   7   7 
  131072    2   7   9 
  262144    5   7   9 
  524288    4   7   9 
  1048576    5   7   9 
  2097152    6   7   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.3607e-02   1.3288e-05   308.24   0.52   0.27   1.35 
  4096   8.4259e-03   1.6457e-05   497.79   0.42   0.17   1.23 
  8192   5.8453e-03   2.2833e-05   717.55   0.58   0.57   1.12 
  16384   4.5087e-03   3.5224e-05   930.26   0.42   0.35   0.97 
  32768   3.7802e-03   5.9066e-05   1109.54   0.32   0.21   0.89 
  65536   3.3151e-03   1.0360e-04   1265.21   0.19   0.12   0.57 
  131072   3.2067e-03   2.0042e-04   1308.00   0.10   0.05   0.32 
  262144   3.1279e-03   3.9099e-04   1340.94   0.05   0.03   0.20 
  524288   3.0800e-03   7.7000e-04   1361.79   0.01   0.01   0.02 
  1048576   2.9968e-03   1.4984e-03   1399.58   0.02   0.02   0.03 
  2097152   3.0424e-03   3.0424e-03   1378.64   0.00   0.01   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   4   6   1   3 
  4096   2   6   4   1   3 
  8192   4   5   6   2   8 
  16384   4   5   2   8   6 
  32768   4   5   6   8   2 
  65536   4   5   6   7   2 
  131072   4   5   8   1   2 
  262144   4   1   7   6   5 
  524288   5   4   3   6   2 
  1048576   4   5   9   6   1 
  2097152   2   8   1   3   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   3   4 
  4096    1   3   6 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   7 
  65536    1   2   7 
  131072    1   5   7 
  262144    1   8   9 
  524288    5   9   9 
  1048576    1   9   9 
  2097152    8   9   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.3783e-02   1.3459e-05   304.32   0.49   0.24   1.31 
  4096   8.4185e-03   1.6442e-05   498.23   0.43   0.18   1.22 
  8192   5.7894e-03   2.2615e-05   724.48   0.58   0.55   1.10 
  16384   4.3986e-03   3.4364e-05   953.55   0.44   0.38   1.00 
  32768   3.7351e-03   5.8361e-05   1122.94   0.31   0.21   0.87 
  65536   3.2875e-03   1.0273e-04   1275.83   0.18   0.11   0.55 
  131072   3.1482e-03   1.9676e-04   1332.28   0.12   0.06   0.34 
  262144   3.0983e-03   3.8729e-04   1353.72   0.02   0.02   0.08 
  524288   3.0338e-03   7.5846e-04   1382.51   0.02   0.01   0.04 
  1048576   2.9988e-03   1.4994e-03   1398.68   0.01   0.01   0.04 
  2097152   2.9098e-03   2.9098e-03   1441.46   0.02   0.02   0.06 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   3 
  4096   2   6   4   1   5 
  8192   4   5   6   8   2 
  16384   4   5   6   8   2 
  32768   4   5   6   8   2 
  65536   4   5   6   1   2 
  131072   5   4   8   1   2 
  262144   6   4   8   5   7 
  524288   4   7   6   2   8 
  1048576   4   5   6   8   1 
  2097152   8   5   9   2   7 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   3   6 
  4096    1   3   6 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   7 
  65536    1   2   7 
  131072    2   3   7 
  262144    3   8   9 
  524288    4   9   9 
  1048576    4   9   9 
  2097152    2   8   9 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   9.6603e-03   9.4339e-06   434.18   0.78   0.47   1.94 
  4096   5.6244e-03   1.0985e-05   745.73   0.68   0.42   1.71 
  8192   3.7227e-03   1.4542e-05   1126.68   0.95   1.10   1.32 
  16384   2.5043e-03   1.9565e-05   1674.82   0.58   0.69   0.82 
  32768   1.8443e-03   2.8818e-05   2274.16   0.41   0.49   0.57 
  65536   1.5909e-03   4.9714e-05   2636.49   0.19   0.22   0.26 
  131072   1.7022e-03   1.0638e-04   2464.11   0.08   0.10   0.14 
  262144   2.1134e-03   2.6418e-04   1984.60   0.04   0.04   0.07 
  524288   2.7079e-03   6.7699e-04   1548.89   0.02   0.02   0.04 
  1048576   2.8409e-03   1.4205e-03   1476.39   0.01   0.01   0.02 
  2097152   2.8818e-03   2.8818e-03   1455.43   0.01   0.01   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   6   2   4   1   5 
  4096   6   4   2   1   5 
  8192   4   5   6   2   8 
  16384   4   5   6   8   2 
  32768   4   5   6   8   2 
  65536   4   5   6   1   7 
  131072   4   5   6   1   2 
  262144   5   4   8   6   7 
  524288   4   5   7   2   6 
  1048576   4   2   5   1   3 
  2097152   6   7   4   5   3 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   3 
  4096    1   1   3 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   1   2 
  65536    1   2   5 
  131072    2   2   9 
  262144    2   7   9 
  524288    2   9   9 
  1048576    2   9   9 
  2097152    7   9   9 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:20:16 EDT.
81253 accesses since 1/2/96.