OpenVZ机器的venet0网络突然宕机

Question

我无法猜测网络故障的原因，但看起来您的容器耗尽了分配的资源，这可能会间接导致问题。你可以vzubc在HN上运行看到这样的情况：

----------------------------------------------------------------
CT 1078      | HELD Bar% Lim%| MAXH Bar% Lim%| BAR | LIM | FAIL
-------------+---------------+---------------+-----+-----+------
  lockedpages|   -    -    - |12.3M   1%   1%|   1G|   1G|    - 
    physpages| 144M   -   14%| 274M   -   26%|   - |   1G|    - 
  vmguarpages|   -    -    - |   -    -    - |   2G|   - |    - 
 oomguarpages| 131M  12%   - | 132M  13%   - |   1G|   - |    - 
    swappages|39.6M   -    3%|44.3M   -    4%|   - |   1G|    - 

----------------------------------------------------------------
CT 1072      | HELD Bar% Lim%| MAXH Bar% Lim%| BAR | LIM | FAIL
-------------+---------------+---------------+-----+-----+------
     kmemsize|5.51M   4%   4%|6.37M   5%   5%| 128M| 128M|    - 
  lockedpages|   -    -    - | 580K  56%  56%|   1M|   1M|    2 
  privvmpages| 582M  14%  14%| 625M  15%  15%|   4G|   4G|    4 
     shmpages| 256K 0.3% 0.3%| 260K 0.3% 0.3%|  84M|  84M|    - 
      numproc|  68   28%  28%|  84   35%  35%| 240 | 240 |    - 
    physpages|43.7M   -    - |60.1M   -    - |   - |   - |    - 
  vmguarpages|   -    -    - |   -    -    - | 132M|   - |    - 
 oomguarpages|4.88M   4%   - |5.94M   5%   - | 102M|   - |    - 
   numtcpsock|   3  0.8% 0.8%|   4    1%   1%| 360 | 360 |    - 
     numflock|   1  0.5% 0.5%|   3    2%   2%| 188 | 206 |    - 
       numpty|   -    -    - |   -    -    - |  16 |  16 |    - 
   numsiginfo|   -    -    - |   9    3%   3%| 256 | 256 |    - 
    tcpsndbuf|51.1K   3%   2%|68.1K   4%   2%|1.64M|2.58M|    - 
    tcprcvbuf|  48K   2%   2%|  64K   3%   2%|1.64M|2.58M|    - 
 othersockbuf|4.52K 0.4% 0.2%|12.8K   1% 0.6%|1.07M|   2M|    - 
  dgramrcvbuf|   -    -    - |   -    -    - | 256K| 256K|    - 
 numothersock|   5  0.7% 0.7%|   8    1%   1%| 720 | 720 |    - 
   dcachesize|3.45M 106%  99%|3.46M 106% 100%|3.25M|3.46M|    - 
      numfile| 153    2%   2%| 260    2%   2%|9.09K|9.09K|    - 
    numiptent|  20   15%  15%|  20   15%  15%| 128 | 128 |    -

看/proc/user_beancounters和UBC参数表上面显示的参数的含义。请注意，根据是否存在，可能有 2 种类型的输出VSWAP启用（CT 1078）或未启用（CT 1072）。

每个表中需要注意的是 FAIL 计数器。这意味着容器过去尝试请求超过其屏障 (BAR) 或限制 (LIM) 值而未能分配该资源的次数。因此，如果 FAIL 大于 0 并且仍然不断增加，则需要为该资源分配更多资源。

vzctl您可以随时增加/减少 BAR 或 LIM 。对于具有 VSWAP 的容器，您可以分别增加（physpages内存）或swappages（虚拟交换）。--ram--swap

vzctl set 1078 --save --ram 2G --swap 2G

对于没有 VSWAP 的容器，您通常会增加privvmpages内存，有时也需要调整其他资源。

vzctl set 1072 --save --privvmpages 5G

FAIL 计数器在其所属容器启动时重置为 0。 vzubc -r显示自上次运行以来 FAIL 计数器的相对值。

Answer 1