Python 套接字:Linux 中出现 TCP 错误,而同一程序在 Windows10 上运行良好

Python 套接字:Linux 中出现 TCP 错误,而同一程序在 Windows10 上运行良好

我正在尝试使用 python 套接字通过 TCP/IP 与商业电源设备通信。

我尝试使用虚拟 linux(centos8stream) 和虚拟 windows10,它们都在同一台物理计算机上运行,​​使用相同的网络接口。两者都有 python3.9。

我想象 tcp/ip 套接字在两个操作系统上的工作方式相同,但我仅在 linux 中遇到了一些通信问题:

  • 经过几次尝试后,发送和接收之间的延迟变得更长(2 秒而不是 0.14 秒)
  • 有时我会遇到超时并且根本无法与设备通信。

我在两个操作系统上都运行了 Wireshark:

  • 在 Windows 中没有异常消息(很少有 TCP 重传)
  • 在 Linux 中,一段时间后(或有时立即),wireshark 就会被 TCP Dup Ack、TCP Fast Retransmission 和 TCP Spurious Retransmissions 淹没。

我的问题:

  1. 差异的根源可能是什么? 是否有我可以尝试的套接字选项?
  2. 有没有办法比较linux和windows10中的网络参数?

连续读取设备标识的示例程序:

import socket
from time import sleep,time
HOST = '10.27.4.50'
PORT = 4444

#Create object and open the connection
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect((HOST, PORT))

client.settimeout(5)

# Read identification
message=(b'*IDN?\r\n')

for i in range(5):
    start_time = time()
    client.sendall(message)
    rep=client.recv(1024)
    print("Trial {}, delay: {} seconds ".format(i,time() - start_time))
    sleep(1)

client.close()

视窗:

Trial 0, delay: 0.17121100425720215 seconds
Trial 1, delay: 0.10957813262939453 seconds
Trial 2, delay: 0.17148327827453613 seconds
Trial 3, delay: 0.13976049423217773 seconds
Trial 4, delay: 0.14109373092651367 seconds

linux(看到最后一条消息花费了更长时间才收到响应,这对应于 TCP 错误的开始)

Trial 0, delay: 0.15080499649 seconds
Trial 1, delay: 0.143104076385 seconds
Trial 2, delay: 0.170531988144 seconds
Trial 3, delay: 0.183187961578 seconds
Trial 4, delay: 2.0480530262 seconds

注意:我也尝试了物理 Linux 机器,遇到了同样的问题。

答案1

我认为问题与 tcp 时间戳有关。在 Linux 中,默认情况下启用 tcp_timestamp,而在 Windows 中则禁用。

在Linux上禁用tcp时间戳,解决问题:

sysctl -w net.ipv4.tcp_timestamps=0

相反,在 Windows 上启用时间戳会重现我在 Linux 上观察到的相同问题。

netsh int tcp set global timestamps=enabled

进一步挖掘后,我发现当设备发送一个数据包时,开始出现诸如 Dup Ack 之类的 tcp 错误,其时间戳低于前一个数据包。设备的硬件/固件可能存在错误,从而产生了错误的时间戳。

相关内容