执行和获取 Bash 脚本之间出现奇怪的不一致

Question

我已经在 Debian 12 中测试了您的脚本（本地主机到本地主机，单独的工作目录），并确认了问题。我nc的来自netcat-traditional 1.10-47(即不是来自netcat-openbsd）。

问题出-q 0在听力上nc。从man 1 nc：

-q seconds
在 stdin 上的 EOF 后，等待指定的秒数，然后退出。如果秒为负数，则永远等待。

似乎监听nc在退出之前等待传入连接-q 0，但它不等待传入数据。建立连接和传输数据是单独的事件，因为-q 0该工具通常会在中间退出。这是一场比赛；在我的测试中听力nc 有时确实将传入数据中继到管道。

触发意外行为的 EOF 会立即发生，因为当没有作业控制的 shell 运行异步命令时（以终止&，这就是您使用监听运行循环的方式nc），它必须将其标准输入重定向到/dev/null或重定向到等效文件。

当您获取脚本时，交互式 shell 会解释它。它可能是启用了作业控制的 bash（交互式 bash 的默认行为）。如果是这样，它会在单独的进程组中运行后台循环，但其标准输入仍然连接到终端（通常这允许我们进行fg后台作业并键入它）。对于后台作业，无法从终端窃取来自 SIGTTIN 的输入，EOF 永远不会发生。这样，当脚本被获取时，监听nc就不会受到-q 0在没有获取的情况下运行脚本时出现的问题。

指定-q 1聆听nc将在实践中有所帮助（虽然理论上仍然很活跃，我猜），但我认为最好使用-q -1（永远等待）或简单地省略-q（在我的测试中默认行为似乎成为“永远等待”）。

-q 0因为连接nc（tmux 内的连接）是有意义的，您确实希望nc在发送有效负载后立即退出。

nc您的 Arch 上的行为有所不同，可能是因为它不同，或者可能是因为当时操作系统的整体压力影响了比赛。

教训是：如果nc+nc -l对仅在一个方向发送数据（每行使用一个这样的对），那么-q 0对于发送方来说是一个有用的选项；但对于接收者来说这是不必要的，在某些情况下甚至是有害的。

还有更多需要改进的地方，例如：

存在代码注入漏洞（./lanchat <local_ip>:<local_port> <remote_ip>:<remote_port>"'; rogue command'"）；
nc当一端或另一端没有监听时，存在很短的时间窗口；
一对ncs 足以处理整个“会话”。

我不会在这里讨论这些问题，但我可以给你一个替代脚本的草图：

#!/usr/bin/env bash

target="$(tmux new -dP 'tail -f /dev/null')"
uptty="$(tmux display-message -p -F '#{pane_tty}' -t "$target")"
tmux split -t "$target" -v "
   rlwrap tee    >(sed -u 's/^/      < /' | ts %H:%M >${uptty@Q}) \
   | nc ${*@Q} > >(sed -u 's/^/> /'       | ts %H:%M >${uptty@Q})
"
tmux a -t "$target"

该脚本确实需要 bash（用于其自身和 tmux 内部）。您可以使用要提供给的参数来运行它nc，例如

首先是聆听方：./lanchat -n -l -s 192.168.11.22 -p 2345,
然后是连接边：./lanchat 192.168.11.22 2345。

单个nc连接nc处理双向的所有通信。该脚本用于时间戳（如果需要，ts您可以删除两个实例）和使用 readline 进行行编辑（如果需要，您可以删除）。不便于携带；没有会导致缓冲问题，除非你也摆脱了。| ts %H:%Mrlwraprlwrapsed -used-uts

在 bash 5.2.15、tmux 3.3a 中测试。

Answer 1