COMMTEST SP3-375 Point-to-Point Communication Performance

Performance Studies using

COMMTEST


IBM SP3-375 Winterhawk II SWAP Performance

(unordered swap of 2MB message using MPI between two nodes)

(performance measured per processor when all processors in node communicating)

Date/Person: May 25, 2000 / P. Worley
Platform: IBM SP3 at Oak Ridge National Laboratory (eagle.ccs.ornl.gov):
     160 4-way Winterhawk II SMP nodes (375MHz POWER3 with 8MB L2 cache)
Environment: AIX 4.3.3;   PSSP 3.1.1
Communication Library: shared memory MPI within a node, MPI over the switch between nodes, using User Space protocol in both cases
SWAP size: 262144 REAL*8 floating point values each direction
Message size: Largest - 262144 REAL*8 floating point values
Smallest - 256 REAL*8 floating point values
Processors: 0 and 4
1 and 5
2 and 6
3 and 7
Latency Definition:(T1024-T512)/512
Model Error Range:[1,1024]
Results:

unordered simple swap
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 43.22 87.70 35.5%
1 iter. 45.11 88.53 24.3%
10 iter. 46.57 93.05 24.8%

unordered swap using nonblocking send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.28 88.32 26.6%
1 iter. 46.84 92.85 25.3%
10 iter. 47.17 92.77 25.3%
cache inv. w/overlap 46.36 89.20 26.4%
1 iter. w/overlap 46.91 90.77 26.0%
10 iter. w/overlap 47.10 93.55 25.0%

unordered swap using nonblocking receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.20 91.73 27.8%
1 iter. 46.56 97.64 26.2%
10 iter. 42.39 94.46 20.1%
cache inv. w/overlap 46.12 90.37 27.7%
1 iter. w/overlap 46.96 89.91 27.4%
10 iter. w/overlap 42.26 94.18 19.8%

unordered swap using nonblocking send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.39 90.06 27.7%
1 iter. 47.12 90.54 28.2%
10 iter. 42.50 92.72 20.7%
cache inv. w/overlap 46.44 87.12 28.3%
1 iter. w/overlap 44.02 94.25 22.6%
10 iter. w/overlap 41.67 95.39 18.2%

unordered swap using ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.30 170.08 4.4%
1 iter. 46.94 169.72 3.3%
10 iter. 47.21 171.47 4.0%
cache inv. w/overlap 46.38 89.95 3.6%
1 iter. w/overlap 47.04 90.00 7.1%
10 iter. w/overlap 47.30 95.54 7.2%

unordered swap using nonblocking ready send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.72 171.57 5.0%
1 iter. 46.99 173.05 3.6%
10 iter. 47.23 172.09 3.2%
cache inv. w/overlap 46.25 88.57 3.4%
1 iter. w/overlap 46.93 95.84 9.5%
10 iter. w/overlap 47.35 94.66 7.9%

native sendrecv
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.16 94.64 27.1%
1 iter. 43.44 90.52 22.8%
10 iter. 42.89 94.17 20.9%

unordered swap using nonblocking sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.34 236.01 4.1%
1 iter. 46.84 242.85 2.6%
10 iter. 47.23 241.58 2.7%
cache inv. w/overlap 46.38 235.57 4.4%
1 iter. w/overlap 46.92 244.27 2.9%
10 iter. w/overlap 47.21 239.94 2.7%

unordered swap using nonblocking receive with sync. send
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.20 238.25 13.5%
1 iter. 46.70 242.52 12.6%
10 iter. 42.31 244.73 5.6%
cache inv. w/overlap 46.26 238.50 13.0%
1 iter. w/overlap 43.65 241.20 7.0%
10 iter. w/overlap 42.46 241.05 4.5%

unordered swap using nonblocking sync. send and receive
Data Statistics
bidirectional bandwidth estimated latency model error
(peak MByte/sec) (usec/msg) (max. rel. error)
cache inv. 46.04 236.84 13.1%
1 iter. 46.72 236.87 13.2%
10 iter. 44.11 243.78 6.8%
cache inv. w/overlap 46.35 232.63 15.2%
1 iter. w/overlap 46.48 219.03 15.3%
10 iter. w/overlap 41.84 220.71 5.1%


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv./no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7923e-01   1.7503e-04   23.40   0.37   0.50   0.91 
  4096   1.3281e-01   2.5940e-04   31.58   0.28   0.36   0.67 
  8192   1.3246e-01   5.1743e-04   31.66   0.15   0.19   0.20 
  16384   1.1222e-01   8.7671e-04   37.38   0.11   0.14   0.16 
  32768   1.0601e-01   1.6564e-03   39.56   0.08   0.14   0.15 
  65536   9.9470e-02   3.1084e-03   42.17   0.08   0.14   0.15 
  131072   9.4461e-02   5.9038e-03   44.40   0.07   0.12   0.13 
  262144   9.2547e-02   1.1568e-02   45.32   0.13   0.13   0.64 
  524288   9.1325e-02   2.2831e-02   45.93   0.07   0.11   0.13 
  1048576   8.9771e-02   4.4886e-02   46.72   0.06   0.08   0.18 
  2097152   9.0406e-02   9.0406e-02   46.39   0.02   0.00   0.17 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   1   2   6   3 
  4096   6   2   0   1   3 
  8192   5   4   1   0   7 
  16384   4   5   7   1   0 
  32768   5   4   7   1   0 
  65536   4   5   7   1   0 
  131072   4   5   1   7   0 
  262144   4   7   5   1   2 
  524288   5   1   4   7   0 
  1048576   5   7   1   4   8 
  2097152   3   4   7   1   8 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    3   5   5 
  4096    2   5   5 
  8192    2   2   10 
  16384    2   2   10 
  32768    2   5   10 
  65536    2   5   10 
  131072    2   5   10 
  262144    4   4   9 
  524288    4   4   10 
  1048576    2   4   10 
  2097152    9   9   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7879e-01   1.7460e-04   23.46   0.38   0.49   0.92 
  4096   1.2899e-01   2.5193e-04   32.52   0.30   0.39   0.70 
  8192   1.3019e-01   5.0857e-04   32.22   0.15   0.19   0.20 
  16384   1.0854e-01   8.4795e-04   38.64   0.11   0.15   0.17 
  32768   1.0365e-01   1.6195e-03   40.47   0.09   0.14   0.15 
  65536   9.7431e-02   3.0447e-03   43.05   0.08   0.14   0.15 
  131072   9.3008e-02   5.8130e-03   45.10   0.08   0.12   0.15 
  262144   9.0969e-02   1.1371e-02   46.11   0.07   0.11   0.14 
  524288   8.9681e-02   2.2420e-02   46.77   0.05   0.04   0.14 
  1048576   8.9699e-02   4.4849e-02   46.76   0.05   0.08   0.10 
  2097152   8.9007e-02   8.9007e-02   47.12   0.03   0.01   0.13 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   2   6   3   1 
  4096   2   6   1   0   3 
  8192   4   5   7   1   0 
  16384   4   5   1   7   0 
  32768   4   5   7   1   0 
  65536   4   5   1   7   0 
  131072   4   5   1   7   0 
  262144   4   5   1   7   0 
  524288   5   7   4   1   0 
  1048576   5   1   8   4   7 
  2097152   3   5   4   7   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    5   5   5 
  4096    1   5   5 
  8192    2   2   10 
  16384    2   2   10 
  32768    2   4   10 
  65536    2   5   10 
  131072    2   4   10 
  262144    4   5   10 
  524288    4   6   10 
  1048576    5   5   10 
  2097152    6   7   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations/no overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7803e-01   1.7386e-04   23.56   0.38   0.49   0.93 
  4096   1.3010e-01   2.5411e-04   32.24   0.28   0.37   0.68 
  8192   1.2954e-01   5.0601e-04   32.38   0.15   0.19   0.20 
  16384   1.0658e-01   8.3262e-04   39.36   0.12   0.16   0.17 
  32768   1.0231e-01   1.5985e-03   41.00   0.09   0.15   0.15 
  65536   9.6284e-02   3.0089e-03   43.56   0.08   0.14   0.15 
  131072   9.2130e-02   5.7581e-03   45.53   0.07   0.13   0.14 
  262144   9.0188e-02   1.1274e-02   46.51   0.07   0.12   0.14 
  524288   8.9272e-02   2.2318e-02   46.98   0.06   0.12   0.14 
  1048576   8.8971e-02   4.4486e-02   47.14   0.07   0.12   0.15 
  2097152   8.8810e-02   8.8810e-02   47.23   0.06   0.07   0.12 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   1   0   6   2   3 
  4096   6   2   1   0   3 
  8192   4   5   7   1   0 
  16384   4   5   1   7   0 
  32768   5   4   1   7   0 
  65536   5   4   7   1   0 
  131072   4   5   1   7   0 
  262144   5   4   7   1   0 
  524288   5   4   7   1   0 
  1048576   7   4   1   5   0 
  2097152   7   5   4   1   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    5   5   5 
  4096    4   5   5 
  8192    2   2   10 
  16384    2   2   10 
  32768    2   4   10 
  65536    2   5   10 
  131072    2   5   10 
  262144    5   5   10 
  524288    5   5   10 
  1048576    4   5   10 
  2097152    4   4   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (cache inv. with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7932e-01   1.7511e-04   23.39   0.27   0.01   0.90 
  4096   1.3364e-01   2.6102e-04   31.38   0.20   0.01   0.65 
  8192   1.0967e-01   4.2840e-04   38.24   0.34   0.41   0.44 
  16384   1.0255e-01   8.0120e-04   40.90   0.19   0.25   0.27 
  32768   9.9715e-02   1.5580e-03   42.06   0.15   0.21   0.24 
  65536   9.5799e-02   2.9937e-03   43.78   0.18   0.18   0.71 
  131072   9.2998e-02   5.8124e-03   45.10   0.09   0.14   0.17 
  262144   9.1933e-02   1.1492e-02   45.62   0.10   0.14   0.29 
  524288   9.0705e-02   2.2676e-02   46.24   0.07   0.12   0.14 
  1048576   9.0556e-02   4.5278e-02   46.32   0.04   0.06   0.12 
  2097152   9.0324e-02   9.0324e-02   46.44   0.02   0.00   0.17 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   1   3   4   6   2 
  4096   1   6   4   2   0 
  8192   5   4   1   9   7 
  16384   4   5   7   1   0 
  32768   5   4   7   1   0 
  65536   5   4   7   1   8 
  131072   4   5   7   1   0 
  262144   4   5   7   1   9 
  524288   5   4   1   7   0 
  1048576   4   7   5   9   1 
  2097152   3   7   4   1   9 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    7   7   7 
  4096    5   7   7 
  8192    2   2   2 
  16384    2   2   5 
  32768    2   2   10 
  65536    2   2   9 
  131072    2   5   10 
  262144    3   4   9 
  524288    4   4   10 
  1048576    5   5   10 
  2097152    9   9   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (1 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7886e-01   1.7467e-04   23.45   0.27   0.01   0.91 
  4096   1.3055e-01   2.5499e-04   32.13   0.21   0.02   0.68 
  8192   1.0404e-01   4.0641e-04   40.31   0.38   0.48   0.50 
  16384   9.9241e-02   7.7532e-04   42.26   0.19   0.25   0.28 
  32768   9.7445e-02   1.5226e-03   43.04   0.15   0.21   0.24 
  65536   9.3988e-02   2.9371e-03   44.63   0.12   0.18   0.22 
  131072   9.1580e-02   5.7237e-03   45.80   0.09   0.14   0.20 
  262144   9.0109e-02   1.1264e-02   46.55   0.08   0.13   0.17 
  524288   8.9620e-02   2.2405e-02   46.80   0.06   0.06   0.12 
  1048576   8.9170e-02   4.4585e-02   47.04   0.06   0.08   0.13 
  2097152   8.9166e-02   8.9166e-02   47.04   0.03   0.01   0.14 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   0   6   2   4   1 
  4096   0   5   3   1   4 
  8192   5   4   7   1   0 
  16384   5   4   7   0   1 
  32768   5   4   1   7   0 
  65536   4   5   1   7   0 
  131072   5   4   1   7   0 
  262144   5   4   1   7   0 
  524288   4   5   7   1   0 
  1048576   4   5   1   7   6 
  2097152   4   2   5   7   1 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    7   7   7 
  4096    3   7   7 
  8192    2   2   2 
  16384    2   2   6 
  32768    2   2   10 
  65536    2   2   10 
  131072    2   5   10 
  262144    2   4   10 
  524288    4   5   10 
  1048576    4   4   10 
  2097152    6   7   10 


Protocol Sensitivity Summary for Bidirectional Swap of 2097152 Bytes (10 iterations with overlap)
Runtime Statistics
Msg Sizemin Secmin Sec/Msgmax MBytes/Sec(mean-min)/min(median-min)/min(max-min)/min
  2048   1.7803e-01   1.7385e-04   23.56   0.27   0.00   0.91 
  4096   1.2937e-01   2.5267e-04   32.42   0.21   0.01   0.68 
  8192   1.0458e-01   4.0850e-04   40.11   0.37   0.46   0.48 
  16384   9.8132e-02   7.6666e-04   42.74   0.19   0.26   0.27 
  32768   9.6159e-02   1.5025e-03   43.62   0.15   0.21   0.24 
  65536   9.3029e-02   2.9071e-03   45.09   0.12   0.19   0.22 
  131072   9.0472e-02   5.6545e-03   46.36   0.09   0.15   0.19 
  262144   8.9231e-02   1.1154e-02   47.01   0.08   0.14   0.17 
  524288   8.8857e-02   2.2214e-02   47.20   0.07   0.12   0.16 
  1048576   8.8586e-02   4.4293e-02   47.35   0.07   0.12   0.18 
  2097152   8.8844e-02   8.8844e-02   47.21   0.06   0.09   0.13 
Five Fastest
Protocols
Msg Size1st2nd3rd4th5th
  2048   2   1   4   0   6 
  4096   4   2   6   1   3 
  8192   5   4   1   7   0 
  16384   5   4   1   7   0 
  32768   5   4   1   7   0 
  65536   5   4   7   1   0 
  131072   5   4   7   1   0 
  262144   4   5   7   1   0 
  524288   5   4   7   1   0 
  1048576   5   4   7   1   0 
  2097152   5   4   1   7   0 
       Number of Proctocols With
Runtimes Within X% of Min
Msg Size1%5%25%
  2048    7   7   7 
  4096    6   7   7 
  8192    2   2   2 
  16384    2   2   5 
  32768    2   2   10 
  65536    2   2   10 
  131072    2   5   10 
  262144    2   5   10 
  524288    4   5   10 
  1048576    4   5   10 
  2097152    4   4   10 

DISCUSSION


Patrick H. Worley / ( worleyph@ornl.gov)
Last Modified Monday, 15-Jul-2002 10:18:41 EDT.
86052 accesses since 1/2/96.