COMMTEST IBM p690 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM p690 SWAP Performance

(ordered swap of 2MB message using MPI within a node)

Date/Person: April 4, 2002 / P. Worley
Platform: IBM p690 at Oak Ridge National Laboratory (cheetah.ccs.ornl.gov):
     p690 32-way Turbo SMP node (1.3 GHz POWER4)
Environment: AIX 5.1L
Communication Library: MPI
Communication Library: MPI
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 1, both on the same node
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

ordered simple swap
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1141.78 9.35 49.1%
1 iter.1175.56 9.19 49.7%
10 iter.1554.66 9.74 41.2%

ordered swap using nonblocking send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1144.91 11.03 46.0%
1 iter.1171.38 11.03 46.0%
10 iter.1535.13 10.80 39.6%
cache inv. w/overlap1137.51 10.53 47.1%
1 iter. w/overlap1169.42 10.53 47.1%
10 iter. w/overlap1531.37 11.03 38.5%

ordered swap using nonblocking receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1151.94 10.70 46.6%
1 iter.1181.27 10.50 46.9%
10 iter.1531.80 10.14 40.7%
cache inv. w/overlap1136.60 10.30 47.8%
1 iter. w/overlap1181.05 10.17 48.3%
10 iter. w/overlap1541.97 10.71 38.7%

ordered swap using nonblocking send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1135.26 11.71 45.1%
1 iter.1168.88 11.68 45.1%
10 iter.1510.97 11.81 34.0%
cache inv. w/overlap1142.75 11.49 41.3%
1 iter. w/overlap1162.83 11.50 41.9%
10 iter. w/overlap1508.90 12.29 34.9%

ordered swap using ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1149.15 12.37 27.8%
1 iter.1177.04 12.37 27.4%
10 iter.1732.64 12.64 33.7%
cache inv. w/overlap1147.42 10.41 28.0%
1 iter. w/overlap1181.32 10.41 29.4%
10 iter. w/overlap1794.09 11.19 36.3%

ordered swap using nonblocking ready send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1146.68 13.81 26.9%
1 iter.1170.96 13.95 25.9%
10 iter.1704.61 14.37 32.6%
cache inv. w/overlap1136.90 11.76 27.4%
1 iter. w/overlap1179.70 11.55 27.7%
10 iter. w/overlap1740.91 12.56 34.3%

synchronous
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1151.08 10.90 46.9%
1 iter.1165.22 10.95 46.8%
10 iter.1532.45 11.25 39.0%

ordered swap using nonblocking sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1134.68 21.44 24.8%
1 iter.1180.05 21.36 24.9%
10 iter.1534.98 22.94 26.9%
cache inv. w/overlap1141.41 20.49 26.1%
1 iter. w/overlap1168.23 20.07 26.4%
10 iter. w/overlap1529.65 22.68 26.5%

ordered swap using nonblocking receive with sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1144.44 22.53 22.4%
1 iter.1171.28 22.25 23.0%
10 iter.1530.50 21.65 25.3%
cache inv. w/overlap1155.74 21.51 25.1%
1 iter. w/overlap1177.52 21.73 23.1%
10 iter. w/overlap1535.70 21.83 25.6%

ordered swap using nonblocking sync. send and receive
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1139.29 21.92 24.8%
1 iter.1165.57 21.95 24.8%
10 iter.1513.49 22.05 25.5%
cache inv. w/overlap1135.56 20.82 23.6%
1 iter. w/overlap1161.43 21.09 22.7%
10 iter. w/overlap1507.60 23.54 27.1%

ordered simple swap using sync. send
Data Statistics
unidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv.1138.16 21.37 23.3%
1 iter.1163.70 21.30 22.6%
10 iter.1559.93 21.12 26.2%


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5590e-02   2.4990e-05   163.90   0.46   0.24   1.03 
  4096   1.6018e-02   3.1285e-05   261.85   0.35   0.19   0.84 
  8192   1.2349e-02   4.8237e-05   339.65   0.32   0.39   0.43 
  16384   9.0621e-03   7.0798e-05   462.84   0.21   0.25   0.29 
  32768   7.2527e-03   1.1332e-04   578.31   0.14   0.16   0.19 
  65536   5.5725e-03   1.7414e-04   752.68   0.09   0.11   0.13 
  131072   4.5689e-03   2.8555e-04   918.02   0.06   0.07   0.08 
  262144   4.1989e-03   5.2486e-04   998.91   0.03   0.03   0.05 
  524288   3.9536e-03   9.8840e-04   1060.88   0.02   0.02   0.03 
  1048576   3.7504e-03   1.8752e-03   1118.36   0.02   0.02   0.03 
  2097152   3.6109e-03   3.6109e-03   1161.57   0.01   0.01   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   0   10   2 
  16384   4   5   0   10   2 
  32768   4   5   0   10   2 
  65536   4   5   0   10   8 
  131072   4   5   10   0   2 
  262144   4   5   0   8   3 
  524288   5   4   10   6   2 
  1048576   4   9   5   6   1 
  2097152   4   8   2   1   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   1   2 
  16384    1   2   5 
  32768    1   2   11 
  65536    2   2   11 
  131072    1   2   11 
  262144    1   11   11 
  524288    2   11   11 
  1048576    2   11   11 
  2097152    7   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5412e-02   2.4816e-05   165.05   0.46   0.24   1.03 
  4096   1.6005e-02   3.1259e-05   262.07   0.35   0.18   0.82 
  8192   1.2443e-02   4.8607e-05   337.07   0.30   0.35   0.40 
  16384   8.8153e-03   6.8870e-05   475.80   0.23   0.27   0.31 
  32768   7.0868e-03   1.1073e-04   591.84   0.15   0.18   0.20 
  65536   5.4597e-03   1.7062e-04   768.23   0.10   0.11   0.13 
  131072   4.5174e-03   2.8234e-04   928.47   0.05   0.05   0.08 
  262144   4.0752e-03   5.0940e-04   1029.22   0.03   0.03   0.05 
  524288   3.8468e-03   9.6171e-04   1090.32   0.01   0.02   0.02 
  1048576   3.6402e-03   1.8201e-03   1152.23   0.02   0.02   0.04 
  2097152   3.4208e-03   3.4208e-03   1226.12   0.01   0.02   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   10   0   2 
  16384   4   5   10   0   2 
  32768   4   5   0   10   2 
  65536   4   5   10   0   1 
  131072   5   4   0   10   2 
  262144   4   5   10   0   6 
  524288   5   4   7   2   1 
  1048576   4   5   2   7   10 
  2097152   4   9   10   8   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   6 
  4096    1   1   6 
  8192    1   2   2 
  16384    1   2   4 
  32768    1   2   11 
  65536    1   2   11 
  131072    2   3   11 
  262144    2   11   11 
  524288    4   11   11 
  1048576    3   11   11 
  2097152    2   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2200e-02   2.1680e-05   188.93   0.51   0.27   1.14 
  4096   1.2231e-02   2.3888e-05   342.93   0.46   0.26   1.03 
  8192   8.8970e-03   3.4754e-05   471.43   0.42   0.50   0.56 
  16384   5.5044e-03   4.3003e-05   761.99   0.36   0.41   0.49 
  32768   3.9592e-03   6.1863e-05   1059.38   0.25   0.30   0.33 
  65536   2.8228e-03   8.8214e-05   1485.84   0.18   0.22   0.24 
  131072   2.4208e-03   1.5130e-04   1732.64   0.11   0.13   0.15 
  262144   2.8250e-03   3.5313e-04   1484.69   0.04   0.05   0.06 
  524288   3.6541e-03   9.1352e-04   1147.84   0.02   0.02   0.03 
  1048576   3.7266e-03   1.8633e-03   1125.51   0.01   0.01   0.01 
  2097152   3.6384e-03   3.6384e-03   1152.80   0.00   0.00   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   6   3 
  4096   0   2   1   6   3 
  8192   4   5   0   10   2 
  16384   4   5   0   10   2 
  32768   4   5   0   10   2 
  65536   4   5   0   10   2 
  131072   4   5   10   0   1 
  262144   4   5   0   10   6 
  524288   4   5   0   6   2 
  1048576   4   5   2   6   10 
  2097152   0   6   1   4   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   5 
  4096    1   1   5 
  8192    1   1   2 
  16384    1   1   2 
  32768    1   2   2 
  65536    1   2   11 
  131072    1   2   11 
  262144    1   5   11 
  524288    2   11   11 
  1048576    6   11   11 
  2097152    11   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5372e-02   2.4777e-05   165.31   0.42   0.19   0.98 
  4096   1.5948e-02   3.1148e-05   263.00   0.33   0.15   0.80 
  8192   1.1438e-02   4.4679e-05   366.71   0.39   0.45   0.51 
  16384   8.5269e-03   6.6617e-05   491.89   0.27   0.31   0.35 
  32768   6.9274e-03   1.0824e-04   605.46   0.18   0.21   0.23 
  65536   5.4138e-03   1.6918e-04   774.74   0.11   0.13   0.15 
  131072   4.5025e-03   2.8140e-04   931.56   0.07   0.08   0.09 
  262144   4.1729e-03   5.2161e-04   1005.13   0.03   0.03   0.04 
  524288   3.9184e-03   9.7960e-04   1070.41   0.02   0.02   0.03 
  1048576   3.7659e-03   1.8830e-03   1113.75   0.01   0.01   0.02 
  2097152   3.6032e-03   3.6032e-03   1164.06   0.02   0.02   0.03 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   4   1   6 
  4096   0   2   6   1   4 
  8192   4   5   3   9   10 
  16384   4   5   9   3   10 
  32768   4   5   10   3   9 
  65536   4   5   3   0   9 
  131072   5   4   0   10   2 
  262144   5   4   0   2   10 
  524288   4   5   0   10   2 
  1048576   4   10   8   5   7 
  2097152   2   6   3   9   5 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   7 
  8192    1   2   2 
  16384    1   2   2 
  32768    1   2   11 
  65536    1   2   11 
  131072    2   2   11 
  262144    2   11   11 
  524288    1   11   11 
  1048576    2   11   11 
  2097152    1   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.5092e-02   2.4504e-05   167.16   0.43   0.20   1.01 
  4096   1.5901e-02   3.1057e-05   263.78   0.33   0.15   0.81 
  8192   1.1401e-02   4.4535e-05   367.89   0.39   0.44   0.52 
  16384   8.3915e-03   6.5559e-05   499.83   0.27   0.31   0.35 
  32768   6.9196e-03   1.0812e-04   606.14   0.16   0.19   0.22 
  65536   5.3071e-03   1.6585e-04   790.32   0.11   0.13   0.15 
  131072   4.4332e-03   2.7707e-04   946.11   0.06   0.07   0.08 
  262144   3.9941e-03   4.9926e-04   1050.13   0.04   0.05   0.07 
  524288   3.8045e-03   9.5113e-04   1102.46   0.03   0.03   0.04 
  1048576   3.6712e-03   1.8356e-03   1142.49   0.01   0.01   0.03 
  2097152   3.4367e-03   3.4367e-03   1220.43   0.01   0.01   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   4   6 
  4096   0   2   6   1   4 
  8192   4   5   9   10   3 
  16384   4   5   10   0   9 
  32768   4   5   0   9   3 
  65536   4   5   9   3   10 
  131072   4   5   7   10   8 
  262144   4   5   0   3   6 
  524288   4   10   5   7   0 
  1048576   4   5   7   10   0 
  2097152   5   4   7   1   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   7 
  8192    1   2   2 
  16384    1   2   2 
  32768    2   2   11 
  65536    1   2   11 
  131072    2   2   11 
  262144    1   7   11 
  524288    1   11   11 
  1048576    6   11   11 
  2097152    5   11   11 


Protocol Sensitivity Summary for Unidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   2.2193e-02   2.1673e-05   188.99   0.49   0.21   1.18 
  4096   1.2228e-02   2.3882e-05   343.02   0.42   0.15   0.99 
  8192   7.9974e-03   3.1240e-05   524.46   0.57   0.67   0.74 
  16384   5.1385e-03   4.0144e-05   816.26   0.42   0.47   0.58 
  32768   3.7075e-03   5.7929e-05   1131.32   0.31   0.38   0.40 
  65536   2.7129e-03   8.4777e-05   1546.08   0.21   0.25   0.28 
  131072   2.3378e-03   1.4612e-04   1794.09   0.14   0.17   0.19 
  262144   2.7765e-03   3.4706e-04   1510.63   0.06   0.07   0.08 
  524288   3.6085e-03   9.0214e-04   1162.33   0.03   0.04   0.04 
  1048576   3.7416e-03   1.8708e-03   1121.00   0.01   0.01   0.01 
  2097152   3.6435e-03   3.6435e-03   1151.19   0.00   0.00   0.01 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   1   4   6 
  4096   0   2   4   1   6 
  8192   4   5   0   10   8 
  16384   4   5   10   0   2 
  32768   4   5   0   10   8 
  65536   4   5   0   10   7 
  131072   4   5   10   0   2 
  262144   4   5   0   10   2 
  524288   4   5   0   10   8 
  1048576   4   5   10   0   8 
  2097152   5   4   0   10   6 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    1   1   7 
  4096    1   1   7 
  8192    1   1   2 
  16384    1   2   2 
  32768    1   2   2 
  65536    1   2   5 
  131072    1   2   11 
  262144    1   2   11 
  524288    2   11   11 
  1048576    6   11   11 
  2097152    10   11   11 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:21:15 EDT.
81775 accesses since 1/2/96.