我应该如何配置 Ubuntu/Upstart 以适应不寻常的网络配置？

Question

首先，我为回答我自己的问题而道歉。

其次，事实上，我已经解决了 failsafe.conf 启动延迟问题。虽然我知道这个问题没有太多讨论，但我在其他各种帖子中看到了很多关于类似故障安全/启动延迟问题的活动，所以我将我的研究和解决方案发布出来，供其他遇到类似问题的人参考。

概述

正如在最初的帖子中提到的，我发现的问题是故障安全启动作业对我的系统启动施加了不必要的限制。然后我进一步研究了这个问题，发现了故障安全行为如此的原因。

分析

默认情况下，failsafe.conf 定义了一个启动条件，该条件在启动时有效地触发它（只要文件系统和环回接口可用），并定义了两个可能的停止条件之一：

start on filesystem and net-device-up IFACE=lo
stop on static-network-up or starting rc-sysinit

Failsafe 坚持延迟是因为没有触发“停止”事件。第二个条件 rc-sysinit 是 upstart 运行的最后一个系统初始化任务之一，它有自己的启动条件

start on (filesystem and static-network-up) or failsafe-boot

不具备故障保护功能停止，显然 rc-sysinit 不是开始。一旦超时到期，Failsafe 将发出 failsafe-boot 事件。鉴于 failsafe 已启动，因此隐含“文件系统”，因此两个事件唯一共同的条件是“static-network-up”。Failsafe 正在运行，因为它认为没有任何网络接口处于“up”状态。

原因

通过 /etc/network/if-up.d 反向操作，定义了一个 upstart 脚本，该脚本迭代 /etc/network/interfaces 中定义的所有网络接口，这些接口使用“auto”限定符定义，这意味着该接口将在启动时启动。如何将接口视为“启动”的定义成为一个重要的语义问题，我将在后面进行描述。

当且仅当所有“自动”配置的接口都处于“启动”状态时，upstart 脚本才会发出著名的“static-network-up”事件。这反过来又会允许 rc-sysinit 触发并终止故障保护 - 这就是我的问题的根本原因。我的网络接口在启动时都没有 IP 地址 - 这是设计使然。但“static-network-up”并不遵循接口处于“启动”状态的想法没有一个 IP 地址，因此故障安全会挂起，直到超时为止。

就我的情况而言，我将盒子中的两个物理网卡从属于网桥，并通过分接头将它们暴露给两个不同的虚拟机。一个虚拟机通过一个分接头提供 DHCP，另一个只是同一网络上的服务器。为了使网桥在虚拟机的分接头下正常工作，网卡必须至少处于“UP”状态，被动允许数据包通过。因此，在 /etc/network/interfaces 中使用“auto”似乎是合适的。不是然而，在故障安全看来，这是不合适的，因此唯一的解决方案必须是遵守故障安全语义的解决方案。

那么，解决我的问题的方法有两个：

从我定义的每个网络接口（环回除外）中删除“自动”声明。
创建 upstart 作业以“手动”启动以前的“自动”界面。

我模仿提供的解决方案，为四台设备（两个分接头和两个虚拟桥）分别定义了一项工作这里。

在此配置中，没有“自动”接口，网络脚本现在应该立即发出“static-network-up”，从而强制终止故障保护。最后的修改要求我在每个分接头的接口定义中添加一个“post-up”子句，以调用“brctl”并创建相应的虚拟网桥，这之前是作为“自动”配置的一部分完成的。

因此，我的 /etc/network/interfaces（部分）现在看起来像：

#auto tpRED  (commented out)
  iface tpRED inet manual
  pre-up /usr/sbin/tunctl -t tpRED
  post-up /sbin/brctl addbr brRED

#auto brRED
  iface brRED inet manual
  bridge_ports eth1 tpRED
  bridge_hw xx:yy:aa:bb:cc:dd

严峻考验

酸性测试？重启服务器。当我重启服务器时，故障保护超时已消失，我的网络在功能上完全相同的配置下运行。它成功了！！我只是希望我们能更好地处理“UP”网络接口的语义！！

Answer 1