我正在尝试设置无盘节点/工作站/系统,使用指南中提供的说明无盘系统为了架构Linux(4.13.12-1-ARCH)。
问题
客户端成功连接到TFTP(FTP协议),传输所有文件并显示 GRUB 选择菜单(相关摘录自grub.cfg
):
load_video
set gfxpayload=keep
insmod gzip
insmod ext3
insmod net
insmod tftp
insmod efinet
set root=(tftp,192.168.0.101)
set prefix=(tftp,192.168.0.101)/netboot/grub
linux /netboot/vmlinuz-linux add_efi_memmap root=/dev/nfs rootfstype=nfs nfsroot=192.168.0.101:/srv/[CLIENT OS] nfsrootdebug rw ip=dhcp
initrd /netboot/initramfs-linux.img
我尝试过ip
(https://www.kernel.org/doc/Documentation/filesystems/nfs/nfsroot.txt)
ip=:::::efinet0:dhcp
ip=:::::eno1s0:dhcp
ip=:::::eth0:dhcp
ip=[CLIENT IP]:[SERVER IP]:[GATEWAY IP]:[NETMASK]:[HOSTNAME]:[DEVICE]:dhcp
当linux
和initrd
都已加载时,继续会导致
[FAILED] "Failed to start Switch Root."
See 'systemctl status initrd-switch-root.service' for details.
You are in emergency mode. After logging in, type "journalctl -xb" to view
system logs, "systemctl reboot" to reobot, "systemctl default or ^D to enter into default mode.
Press Enter for maintenance
(or press Control-D to continue):
故障排除
删除 add_efi_mmap
相反Failed to start Switch Root.
,内核会出现恐慌:
[ 1.114386] Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block(0,255)
[ 1.114458] CPU: 3 PID: 1 Comm: swapper/0 Not tainted 4.13.12-1-ARCH #1
[ 1.114509] Hardware name: ASUSTeK COMPUTER INC. UX51V2A/UX51VZA, BIOS UX51VZA.204 12/03/2012
[ 1.114573] Call Trace:
[ 1.114604] dump_stack+0x63/0x8b
[ 1.114637] panic+0xe4/0x23d
[ 1.114667] mount_block_root+0x1f4/0x2ab
[ 1.114703] ? set_debug_rodata+0x17/0x17
[ 1.114737] mount_root+0x6a/0x6d
[ 1.114767] prepare_namespace+0x134/0x16c
[ 1.114802] kernel_init_freeable+0x1ec/0x205
[ 1.114840] ? rest_init+0xe0/0xe0
[ 1.114872] kernel_init+0xc/0xfc
[ 1.114904] ret_from_fork+0x25/0x30
[ 1.114957] Kernel Offset: 0x3000000 from 0xffffffff81000000 (relocation range: 0xffffffff80000000-0xffffffffbfffffff)
[ 1.115040] ---[ end Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block(0,255)
系统调试
我无法访问journalctl。要么未检测到键盘,要么系统冻结,因为我既无法按下Enter
也无法^D
继续。
尝试通过添加systemd.unit=emergency.target
或emergency
到内核 CLI 来直接启动进入紧急模式似乎不起作用。
+(UPDATE 2) 该mkinitcpio
参数break=premount
不会更改systemd
启动。
网络
使用Wireshark,在初始PXE启动后没有网络活动,也就是说,当加载linux
和initrd
加载时,客户端和服务器之间不再有通信。
SERVER IP: 192.168.2.101/24
CLIENT IP: 192.168.2.102/24
GRUB
GRUB 网络_*命令和环境变量似乎表明一切都井然有序; tftp 可以工作。
net_ls_cards efinet0 [CLIENT NETWORK DEVICE MAC]
net_ls_addr efinet0 [CLIENT NETWORK DEVICE MAC] 192.168.2.102
net_ls_routes efinet0:local 192.168.2.0/24 efinet0
efinet0:default 0.0.0.0/0 gw 192.168.2.101
echo $net_default_ip 192.168.2.102
echo $net_default_mac [CLIENT NETWORK DEVICE MAC]
echo $net_default_server 192.168.2.101
echo $net_efinet0_ip 192.168.2.102
echo $net_efinet0_mac [CLIENT NETWORK DEVICE MAC]
echo $net_efinet0_hostname (empty)
echo $net_efinet0_domain (empty)
echo $net_efinet0_dhcp_server_name (empty
echo $net_efinet0_next_server 192.168.0.101
echo $net_efinet0_root_path 102.168.0.101:/srv/[CLIENT OS]
echo $net_efinet0_extensionpath (empty)
内核支持nfsroot
和ip
鉴于没有网络活动,我推测ip
或nfsroot
没有被执行。
事实上,我遇到的问题在问题中有所描述使用 NFS 支持构建内核,但未获取 /dev/nfs。
该问题的答案指出(Andreas Wiese 2014 年 7 月 1 日 14:58)
...确保将 NFS 支持内置到您的内核二进制文件中,而不是作为模块(或者有一个
initramfs
,它可以处理这个问题)。网络驱动程序也是如此:您很可能希望将以太网网卡的驱动程序内置到内核映像中,否则您必须从initramfs
.
简而言之,有几种可能性:
1. 按照上面的链接告诉您:已root=/dev/nfs
设置,给出正确的nfsroot
参数并通过参数告诉您的内核您的网络配置ip
(这将是确保其正常工作的最佳方法,即以排除 DHCP 服务器配置错误的情况)。
2. 启用CONFIG_IP_PNP
并CONFIG_IP_PNP_DHCP
设置 DHCP 守护程序来告诉您的客户端要使用哪个 IP 地址以及在哪里可以找到其 NFS 根目录。
3. 构建一个 initramfs 来进行正确的配置和 NFS 安装。
研究 archlinux 内核
zgrep CONFIG_NFS_FS= /proc/config.gz -> CONFIG_NFS_FS=m
zgrep DHCP /proc/config.gz -> (nothing)
zgrep _IP_PNP_ /proc/config.gz -> CONFIG_IP_PNP is not set
表明archlinux不支持ip
随内核编译。
在错误报告的评论中 (2006)FS#5056 - 默认内核禁用 NFS 根映射
mkinitcpio 已经支持网络启动,无需更改内核
这可以与所提到的问题中接受的答案的评论进行比较。
大约 10 年来,内核不再直接启动 nfs,而是安装一个初始 ramdisk,它会重新解释内核命令行并从您想要的位置启动。 – 彼得 2016-06-17 13:54
mkinitcpio
来自lsinitcpio -a
...
Created with mkinitcpio 24
Kernel: 4.13.12-1-ARCH
Size: 55,63 MiB
Compressed with: gzip
...
Included modules:
... nfs ... nfsv3 nfsv4 [explicit] ...
Included binaries:
... ipconfig ... mount.nsf4 ... nfsmount ...
Early hook run order:
udev
Hook run order:
udev net net_nsf4 nbd
Cleanup hook order:
udev
mkinitcpio 对网络设备的支持(更新 #1)
虽然应该加载网卡的驱动程序,但我想在阅读后确定[已解决] 无盘 - ipconfig:没有要配置的设备。
将网络模块驱动放在/etc/mkinitcpio.conf中。
MODULES=(atl1c nbd nfsv4)
initramfs.img
无论是显式声明该模块还是在客户端上构建整个模块都没有发生任何变化。
如果映像应在不同的计算机上运行,请勿使用自动检测。自动检测会删除在当前运行的系统上启动不需要的所有驱动程序。
从钩子上取下来autodetect
会产生一个有趣的结果;之前观察add_efi_mmap
到的删除时发生的内核恐慌。add_efi_mmap
加载 no- 时删除autodetect
initramfs
没有进一步的影响。
mkinitcpio 支持nfs
Archlinux 可能支持也可能不支持 nsf4。
据我所知,这是一个次要问题;在尝试挂载 nfs 之前,网络必须正常工作。
mkinitcpio 支持ip
我刚刚发现
- mkinitcpio-nfs-utils (0.3-5)包括“ipconfig”,
- 有一个mkinitcpio-netconf 0.0.4-2。
附加信息
这可能相关,也可能不相关。
使用“UEFI PXE boot”而不是“BIOS PXE boot”的原因是GRUB i386-pc无法加载grub.cfg。计算机要么重新启动,要么冻结在“欢迎使用 GRUB!”并且可能会因彩色像素而使屏幕变得混乱;结果似乎是随机的。 Wireshark 日志显示tftp
有时会加载所有 grub 模块,有时则不会。最后的日志条目通常是客户端请求服务器网络设备;ARP 60 Who has [SERVER IP]? Tell [CLIENT IP]?
答案1
根据 Arch Linux wiki 中的说明无盘系统
对于客户端安装
在服务器上的子目录中创建完整的 Arch Linux 安装。
然后
编辑 $root/etc/mkinitcpio.conf 并将 nfsv4 添加到 MODULES,将 net_nfs4 添加到 HOOKS,将 /usr/bin/mount.nfs4 添加到 BINARIES
据我了解,只需添加net_nfs4
到mkinitcpio.conf
.在寻找答案时,我记不起任何有关必要挂钩的信息,相反,我最终net
在阅读其他可能适用于 nfs3 的指南的混乱中添加了挂钩。
终于我遇到了处理ArchLinux在网络上的加载 罗沙尔斯基 2015 年 3 月 22 日 16:14。
这篇文章有一个名为我们准备initramfs这是 Arch Linux wiki 中一开始所熟悉的,
# sed s/nfsmount/mount.nfs4/ "$root/usr/lib/initcpio/hooks/net" > "$root/etc/initcpio/hooks/net_nfs4"
# cp $root/usr/lib/initcpio/install/net $root/etc/initcpio/install/net_nfs4
但在一些关键点上有所不同。
首先,编辑net_nfs4文件,在Arch Linux中是
nano $root/usr/lib/initcpio/install/net_nfs4
build() {
add_checked_modules '/drivers/net/'
add_module nfsv4?
add_binary "/usr/lib/initcpio/ipconfig" "/bin/ipconfig"
# Not sure if it is an Arch Linux specific, but nfsmount is correct;
# mount.nsf4 causes mkinitcpio during build to throw an error like "file not found".
# add_binary "/usr/bin/mount.nfs4" "/bin/mount.nfs4"
add_binary "/usr/bin/nfsmount" "/bin/mount.nfs4"
add_runscript
}
第二,
我们通过更正 mkinitcpio.conf 文件中的行将处理器添加到 initramfs:
nano $root/etc/mkinitcpio.conf
HOOKS="base udev net_nfs4"
更新+(20171210)
试图解决另一个问题/usr/lib/initcpio/hooks/net_nfs4
我在定义的函数中注意到nfs_mount_handler
以下行:
mount.nfs4 ${nfs_option:+-o ${nfs_option}} "${nfs_server}:${nfs_path}" "$1"
根据man mount.nfs4
:
SYNOPSIS
mount.nfs remotetarget dir [-rvVwfnsh ] [-o options]
DESCRIPTION
...
remotetarget is a server share usually in the form of servername:/path/to/share. dir is the directory on which the file system is to be mounted.
...
因此,我将该行更改为:
mount.nfs4 "${nfs_server}:${nfs_path}" "$1" ${nfs_option:+-o ${nfs_option}}