解决方法：

Question 1

我发现我可以使用以下方法使非基于 tty 的 ssh 会话正常工作：

$ ssh username@servername /bin/bash -i

bash: cannot set terminal process group (-1): Inappropriate ioctl for device
bash: no job control in this shell
username@servername:~$

我认为在这种情况下 ioctl 错误是可以预料到的，因为我正在启动一个没有 tty 的交互式会话。此会话中有很多问题（TERM 环境变量甚至没有设置），但我能够进行一些基本的故障排除并发现：

#View a process list with parent process details
ps -axfo pid,uname,cmd | grep badservice | wc -l
27917

基本上，当我们将我们的一个服务与好的服务器进行比较时，我们发现有超过 27900 个进程以其用户名运行

$ salt 'server*' cmd.run 'ps -aux | grep badservice | wc -l'
server.good:
    3
server.bad:
    27918

这很可能导致了与 ptys 相关的某种资源耗尽。停止了有问题的服务，我使用终止了该用户的所有剩余进程sudo kill -u badservice。之后，SSH 又开始按预期工作了！

Answer

我发现我可以使用以下方法使非基于 tty 的 ssh 会话正常工作：

$ ssh username@servername /bin/bash -i

bash: cannot set terminal process group (-1): Inappropriate ioctl for device
bash: no job control in this shell
username@servername:~$

我认为在这种情况下 ioctl 错误是可以预料到的，因为我正在启动一个没有 tty 的交互式会话。此会话中有很多问题（TERM 环境变量甚至没有设置），但我能够进行一些基本的故障排除并发现：

#View a process list with parent process details
ps -axfo pid,uname,cmd | grep badservice | wc -l
27917

基本上，当我们将我们的一个服务与好的服务器进行比较时，我们发现有超过 27900 个进程以其用户名运行

$ salt 'server*' cmd.run 'ps -aux | grep badservice | wc -l'
server.good:
    3
server.bad:
    27918

这很可能导致了与 ptys 相关的某种资源耗尽。停止了有问题的服务，我使用终止了该用户的所有剩余进程sudo kill -u badservice。之后，SSH 又开始按预期工作了！

Question 2

我检查了另一台正在运行的服务器，发现挂载选项有点不同：

Bad Server:  devpts /dev/pts devpts rw,nosuid,noexec,relatime,mode=600,ptmxmode=000 0 0
Good Server: devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000 0 0

我尝试了以下操作，可以更改挂载权限以匹配良好的服务器：

sudo mount -o remount /dev/pts
sudo grep devpts /proc/mounts

devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000 0 0

但是我尝试连接时仍然遇到相同的错误（即使再次重新启动 ssh 后）。

Answer

我检查了另一台正在运行的服务器，发现挂载选项有点不同：

Bad Server:  devpts /dev/pts devpts rw,nosuid,noexec,relatime,mode=600,ptmxmode=000 0 0
Good Server: devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000 0 0

我尝试了以下操作，可以更改挂载权限以匹配良好的服务器：

sudo mount -o remount /dev/pts
sudo grep devpts /proc/mounts

devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000 0 0

但是我尝试连接时仍然遇到相同的错误（即使再次重新启动 ssh 后）。

Question 3

我遇到了同样的问题，这是由于我将 /dev 挂载--rbind到我想要chroot进入的另一台机器的目录中造成的。

mkdir -p /media/snapshot/
mkdir -p /media/test/
mount /dev/vg0/snapshot /media/snapshot/
mount /dev/vg0/test /media/test/
mount -t proc none /media/test/proc
mount --rbind /dev /media/test/dev
mount -t sysfs sysfs /media/test/sys
chroot /media/test/ /bin/bash
exit

这些文件夹被挂载：

udev on /media/test/dev type devtmpfs (rw,nosuid,relatime,size=346156k,nr_inodes=86539,mode=755)
devpts on /media/test/dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
tmpfs on /media/test/dev/shm type tmpfs (rw,nosuid,nodev)
mqueue on /media/test/dev/mqueue type mqueue (rw,relatime)

卸载卷时（表明该卷仍在使用），使用此选项，-l/dev 内的其他挂载点也将被卸载：

umount -l /media/test
ll /dev/pts
total 0
drwxr-xr-x  2 root root   40 Mai 13 07:06 .
drwxr-xr-x 18 root root 4,1K Mai 13 07:07 ..

解决方法：

重新启动服务器并重新创建所有 /dev 挂载

解决方案：

用--bind代替，--rbind则不会发生问题：

mount --bind /dev /media/test/dev

Answer

我遇到了同样的问题，这是由于我将 /dev 挂载--rbind到我想要chroot进入的另一台机器的目录中造成的。

mkdir -p /media/snapshot/
mkdir -p /media/test/
mount /dev/vg0/snapshot /media/snapshot/
mount /dev/vg0/test /media/test/
mount -t proc none /media/test/proc
mount --rbind /dev /media/test/dev
mount -t sysfs sysfs /media/test/sys
chroot /media/test/ /bin/bash
exit

这些文件夹被挂载：

udev on /media/test/dev type devtmpfs (rw,nosuid,relatime,size=346156k,nr_inodes=86539,mode=755)
devpts on /media/test/dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
tmpfs on /media/test/dev/shm type tmpfs (rw,nosuid,nodev)
mqueue on /media/test/dev/mqueue type mqueue (rw,relatime)

卸载卷时（表明该卷仍在使用），使用此选项，-l/dev 内的其他挂载点也将被卸载：

umount -l /media/test
ll /dev/pts
total 0
drwxr-xr-x  2 root root   40 Mai 13 07:06 .
drwxr-xr-x 18 root root 4,1K Mai 13 07:07 ..

解决方法：

重新启动服务器并重新创建所有 /dev 挂载

解决方案：

用--bind代替，--rbind则不会发生问题：

mount --bind /dev /media/test/dev

解决方法：

答案1

答案2

答案3

解决方法：

解决方案：

相关内容