我不太了解网络,但我已经尽了最大努力。
我有一台 HP c7000 机箱,机箱内装有 BL460 g6 刀片,上面安装了最新 (最小版本,因此没有ifconfig
命令) 版本的 CentOS。机箱背面的互连托架 1、2、5 和 6 中安装了 4 台 Cisco Catalyst Blade 3020 交换机。在安装 CentOS 期间,我将以太网电缆从交换机背面插入我的本地网络 (具有 DHCP 服务器),CentOS 检测到存在以太网连接。但安装后,我根本没有互联网连接 (ping 8.8.8.8、1.1.1.1、google.com 结果为“ cannot resolve hostname
”)。此外,所有设备都是二手的,所以我根本没有设置/配置 Cisco 交换机。我能够连接到交换机的控制台页面,但由于我不知道用户名/密码,因此无法对其进行配置。
另外,我尝试从同一网络上的单独设备通过 ssh 进入刀片服务器,但无法连接。此外,运行nmcli
显示 3 个网络连接,、lo
和enp0s0
,enp0s1
并且和enp0s0
均为enp0s1
“未管理”。我尝试更改配置文件以对其进行管理,重置网络管理器以及刀片服务器本身,但均不起作用。此后,我尝试将 HP 4GB 光纤通道直通模块连接到互连托架 3,iLO 显示刀片服务器正确映射到直通模块中的正确端口。然后,我将该端口连接到单独的交换机,并将其连接到本地网络,但此方法无效。
我试图实现的目标是让刀片作为计算集群运行,使用 OpenMPI 在刀片之间进行通信,并且不以任何方式连接到互联网(仅连接到本地网络以使用 ssh 进行控制)。我该如何实现这一目标?据我所知,在前 2 个互连托架中安装 2 个交换机可让刀片相互通信,但即使nmcli
显示它们不是刀片的 IP 地址,只有端口的硬件地址。任何帮助都将不胜感激!
答案1
这些 Catalyst Blade 3020 交换机是非常通用的设备,您确实希望将它们置于已知的配置中。因此,您的第一步应该是执行密码重置程序当然,根据你的实验,它们可能在一个相当简单的配置中...或者可能是以前配置的残余,会给您带来令人沮丧的意外。
将二手开关换成已知配置是必须的。如果您甚至不确定交换机是否将以与网络其余部分兼容的形式传输流量,那么尝试配置刀片的网络接口将不会有太大用处。
可以将交换机配置为仅向特定刀片提供对特定上行链路端口(和/或 VLAN 等等...)的访问,因此您的安装时测试证明访问仅从该特定端口配置到您测试的特定刀片。
如果交换机模块现在连接的网络没有 DHCP 服务器,刀片服务器将无法凭空获取 IP 地址。特别是如果最小安装未包含avahi-daemon
或已禁用 DHCP 服务器。
(avahi-daemon
将为接口分配一个辅助 169.254.*.* IP 地址,该地址在每次重启时可能会有所不同,但选择的方式不会与使用相同方案的任何其他主机发生冲突。)
既然你说你不太懂网络,你能找一个熟悉思科设备的网络管理员来帮助你操作交换机吗?那可能会很有帮助。
另外,学习充分利用机箱和 iLO 连接的管理功能。
前两个 I/O 模块插槽与刀片上的集成 NIC 硬连线:每个半高刀片(如 BL460 G6)有 2 个 NIC,每个 I/O 模块插槽一个。其余插槽可以变化,但您不能只将 I/O 模块插入插槽并让它工作:对于 I/O 模块插槽 3..8,刀片还必须具有相应的夹层卡(手掌大小的扁平电路板)安装到它们上面。
您应该将 I/O 模块和夹层卡视为从中间分开的常规 NIC 和 HBA:PCIe 总线部分位于每个刀片的夹层卡中,而以太网/FC/InfiniBand 特定硬件位于 I/O 模块中,捆绑为 16 个一组。
如果您的刀片在 Mezz1 插槽中安装了光纤通道 HBA 夹层卡,而您在 I/O 模块插槽 3 或 4 中安装了以太网交换机,那么它将无法工作:您实际上是在尝试将光纤通道 SAN 卡的前端连接到以太网 NIC 的后端。底盘管理知道这不是一个可行的组合,因此拒绝启动刀片。
I/O 模块插槽和刀片夹层插槽之间的映射是硬连线的且不可配置。您可以在这里找到映射图:第一个适用于您的情况。