socat 父进程因连接失败而终止

socat 父进程因连接失败而终止

简短的问题

尝试连接分叉socat进程失败似乎会杀死父进程。这是一个错误吗?对此最好的解决方案是什么?

长问题

我正在运行socat带有 OpenSSL 加密的服务器(socat 版本 1.7.3.1 和 1.7.3.2)(用于验证服务器)。我使用以下命令启动服务器:

socat -d -d -d -d -U \
-lf /var/log/socat.log \
openssl-listen:8888,fork,reuseaddr,cert=server.pem,dhparam=dhparam.pem,verify=0 \
gopen:"file.txt" &

我正在使用该fork选项,以便与服务器的每个连接都应该在单独的子进程中运行。我可以使用以下客户端命令成功连接到服务器:

socat - openssl-connect:hostname:8888,cafile=server.crt

我还尝试在不提供服务器证书的情况下进行连接,即:

socat - openssl-connect:hostname:8888

当我这样做时,我收到以下错误(如预期):

YYYY/mm/dd HH:MM:SS socat[3464] E SSL_connect(): error:1416F086:SSL routines:tls_process_server_certificate:certificate verify failed

但服务器进程也会终止。这是出乎意料的。我在其他不成功的连接尝试中得到了类似的结果,例如尝试与 netcat 连接:

nc hostname 8888

在这种情况下,连接会挂起,直到我终止它。但是,和以前一样,这不仅会终止当前的连接尝试(子进程),还会终止服务器(父进程)。

我尝试检查日志文件。在连接尝试期间,以下消息将写入日志文件:

 1  YYYY/mm/dd HH:MM:SS socat[PPID] D select -> (, 0x40, 0x0, 0x0, NULL/0.000000), 1
 2  YYYY/mm/dd HH:MM:SS socat[PPID] D accept(6, 0xbedc0224, 0xbedc020c)
 3  YYYY/mm/dd HH:MM:SS socat[PPID] I accept(6, {2, AF=2 127.0.0.1:54862}, 16) -> 7
 4  YYYY/mm/dd HH:MM:SS socat[PPID] D fcntl(7, 2, 1)
 5  YYYY/mm/dd HH:MM:SS socat[PPID] D fcntl() -> 0
 6  YYYY/mm/dd HH:MM:SS socat[PPID] D getpeername(7, 0xbedc0234, 0xbedc021c{16})
 7  YYYY/mm/dd HH:MM:SS socat[PPID] D getpeername(, {AF=2 127.0.0.1:54862}, {16}) -> 0
 8  YYYY/mm/dd HH:MM:SS socat[PPID] D getsockname(7, 0xbedc02a4, 0xbedc0220{16})
 9  YYYY/mm/dd HH:MM:SS socat[PPID] D getsockname(, {AF=2 127.0.1.1:8888}, {16}) -> 0
10  YYYY/mm/dd HH:MM:SS socat[PPID] N accepting connection from AF=2 127.0.0.1:54862 on AF=2 127.0.1.1:8888
11  YYYY/mm/dd HH:MM:SS socat[PPID] I permitting connection from AF=2 127.0.0.1:54862
12  YYYY/mm/dd HH:MM:SS socat[PPID] D sigprocmask(0, 0xbedc0314, 0x0)
13  YYYY/mm/dd HH:MM:SS socat[PPID] D sigprocmask() -> 0
14  YYYY/mm/dd HH:MM:SS socat[PPID] D fork()
15  YYYY/mm/dd HH:MM:SS socat[PPID] D fork() -> PID
16  YYYY/mm/dd HH:MM:SS socat[PPID] N forked off child process PID
17  YYYY/mm/dd HH:MM:SS socat[PPID] I close(7)
18  YYYY/mm/dd HH:MM:SS socat[PPID] D close()  -> 0
19  YYYY/mm/dd HH:MM:SS socat[PPID] D sigprocmask(1, 0xbedc0314, 0x0)
20  YYYY/mm/dd HH:MM:SS socat[PPID] D sigprocmask() -> 0
21  YYYY/mm/dd HH:MM:SS socat[PPID] I still listening
22  YYYY/mm/dd HH:MM:SS socat[PPID] N listening on AF=2 0.0.0.0:8888
23  YYYY/mm/dd HH:MM:SS socat[PPID] D select(7, &0x48, &0x0, &0x0, NULL/0.000000)
24  YYYY/mm/dd HH:MM:SS socat[PID] D fork() -> 0
25  YYYY/mm/dd HH:MM:SS socat[PID] D getpid()
26  YYYY/mm/dd HH:MM:SS socat[PID] D getpid() -> PID
27  YYYY/mm/dd HH:MM:SS socat[PID] I just born: child process PID
28  YYYY/mm/dd HH:MM:SS socat[PID] D setenv("SOCAT_PID", "0", 1)
29  YYYY/mm/dd HH:MM:SS socat[PID] D setenv() -> 0
30  YYYY/mm/dd HH:MM:SS socat[PID] D getpid()
31  YYYY/mm/dd HH:MM:SS socat[PID] D getpid() -> PID
32  YYYY/mm/dd HH:MM:SS socat[PID] D sigprocmask(1, 0xbedc0314, 0x0)
33  YYYY/mm/dd HH:MM:SS socat[PID] D sigprocmask() -> 0
34  YYYY/mm/dd HH:MM:SS socat[PID] I just born: child process PID
35  YYYY/mm/dd HH:MM:SS socat[PID] D setenv("SOCAT_PID", "PID", 1)
36  YYYY/mm/dd HH:MM:SS socat[PID] D setenv() -> 0
37  YYYY/mm/dd HH:MM:SS socat[PID] I close(6)
38  YYYY/mm/dd HH:MM:SS socat[PID] D close()  -> 0
39  YYYY/mm/dd HH:MM:SS socat[PID] D setenv("SOCAT_SOCKADDR", "127.0.1.1", 1)
40  YYYY/mm/dd HH:MM:SS socat[PID] D setenv() -> 0
41  YYYY/mm/dd HH:MM:SS socat[PID] D setenv("SOCAT_SOCKPORT", "8888", 1)
42  YYYY/mm/dd HH:MM:SS socat[PID] D setenv() -> 0
43  YYYY/mm/dd HH:MM:SS socat[PID] D setenv("SOCAT_PEERADDR", "127.0.0.1", 1)
44  YYYY/mm/dd HH:MM:SS socat[PID] D setenv() -> 0
45  YYYY/mm/dd HH:MM:SS socat[PID] D setenv("SOCAT_PEERPORT", "54862", 1)
46  YYYY/mm/dd HH:MM:SS socat[PID] D setenv() -> 0
47  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_new(0x231f868)
48  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_new() -> 0x2320f00
49  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_set_fd(0x2320f00, 7)
50  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_set_fd() -> 1
51  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_accept(0x2320f00)
52  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_accept() -> -1
53  YYYY/mm/dd HH:MM:SS socat[PID] E SSL_accept(): Success
54  YYYY/mm/dd HH:MM:SS socat[PID] N exit(1)
55  YYYY/mm/dd HH:MM:SS socat[PID] D starting xioexit()
56  YYYY/mm/dd HH:MM:SS socat[PID] D SSL_shutdown(0x2320f00)
57  YYYY/mm/dd HH:MM:SS socat[PPID] N socat_signal(): handling signal 11
58  YYYY/mm/dd HH:MM:SS socat[PPID] D select -> (, 0x8, 0x0, 0x0, NULL/0.000000), 1
59  YYYY/mm/dd HH:MM:SS socat[PPID] D select(7, &0x48, &0x0, &0x0, NULL/0.000000)
60  YYYY/mm/dd HH:MM:SS socat[PPID] E exiting on signal 11
61  YYYY/mm/dd HH:MM:SS socat[PPID] N exit(139)
62  YYYY/mm/dd HH:MM:SS socat[PPID] D starting xioexit()
63  YYYY/mm/dd HH:MM:SS socat[PPID] I close(6)
64  YYYY/mm/dd HH:MM:SS socat[PPID] D close()  -> 0
65  YYYY/mm/dd HH:MM:SS socat[PPID] D finished xioexit()

因此,看起来子进程中存在分段错误(信号 11),这会导致父进程终止。我当前的解决方法是循环运行 socat 命令,例如:

while true; do
socat -d -d -d -d -U \
-lf /var/log/socat.log \
openssl-listen:8888,fork,reuseaddr,cert=server.pem,dhparam=dhparam.pem,verify=0 \
gopen:"file.txt" &
done

但这似乎不太优雅——肯定有更好的解决方案。

相关内容