我有一个在服务器(Linux AWS)上运行的 API,从我进入客户端开始,连接就被远程服务器关闭了。
请注意,没有发生错误/调试的消息,所以我不确定如何解决这个问题。
查看网络数据包。
一些事实:
这在高负载时会发生(CPU 负载超过 100%,RAM 正常)。
这个错误 100% 可重现,如果我以相同的顺序运行相同的请求,它将在相同的请求中崩溃。
客户端和服务器之间有一个负载均衡器(可能是这个吗?)。
问题是我真的很想找到终止此连接的原因(日志/消息/数据包),但不知道如何去做,只能一边玩 tcpdump 一边做。
编辑
负载均衡器正在丢弃一些有关有效负载太大并必须将其写入磁盘的消息。
有一些 wireshark 跟踪(它们与连接断开的时间不匹配)表明 TCP WINDOW 已满。