当 Nginx 499 未将 Web 套接字握手返回给客户端时,如何排除故障?

当 Nginx 499 未将 Web 套接字握手返回给客户端时,如何排除故障?

在 Kubernetes 集群中,我有一个充当反向代理/TLS 终止解决方案的 Nginx 服务器,它将请求代理传递到具有一些由 Web Sockets(SockJS/Stomp)提供支持的功能的后端 Tomcat 应用程序。不幸的是,Web Sockets 握手从未成功完成。

在客户端,在我的浏览器中,我可以在控制台中看到以下消息: Opening Web Socket... websockets-0.1.min.js:116 Whoops! Lost connection to https://myhost/stomp

接着是HTTP 504 Gateway Timeout

websockets-0.1.min.js:72 WebSocket connection to 
'wss://myhost/stomp/673/ugvpxc1lwmfjnung/websocket' 
failed: Error during WebSocket handshake: Unexpected response code: 504 

--

在 tomcat 端,我在访问日志中有以下条目:

0:0:0:0:0:0:0:1,2017-06-01 16:53:36.915 
+0000,4,GET,HTTP/1.1,"/stomp/673/ugvpxc1lwmfjnung/websocket",101,
-,O,-,blablablabla,-,-,"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6)
 AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 
Safari/537.36",-,,-,-,-,-,-,- 

而在 nginx 访问日志中我有相应的条目:

10.2.89.0 - - [01/Jun/2017:16:54:41 +0000] "GET 
/stomp/673/ugvpxc1lwmfjnung/websocket HTTP/1.1" 499 0 "-" "Mozilla/5.0 
(Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/58.0.3029.110 Safari/537.36" "24.5.136.13" 

现在,根据我的研究,客户端关闭连接时会出现 499 代码,但我不明白为什么响应需要这么长时间才能返回到客户端。根据这两个条目的时间戳,这两个事件相隔约 1 分钟。这是怎么回事?

这是我的 nginx.conf 的一个片段,非常感谢任何帮助:

server { 
    listen 9965 default_server ssl; 
    listen [::]:9965 default_server ssl; 

    resolver 127.0.0.1; 
    server_name _; 

    ssl_certificate /etc/ssl/certs/certificate.pem; 
    ssl_certificate_key /etc/ssl/certs/key.pem; 
    ssl_dhparam /etc/ssl/certs/dhparam.pem; 

    client_max_body_size 2000M; 

    location / { 
        proxy_read_timeout 900; 

        proxy_pass_header Server; 

        proxy_http_version 1.1; 
        proxy_set_header Host $host; 
        proxy_set_header X-Real-IP $remote_addr; 
        proxy_set_header Upgrade 'websocket'; 
        proxy_set_header Connection "upgrade"; 

        proxy_pass http://localhost:15010; 
    } 

--

关于如何进一步解决此问题有什么想法吗?

答案1

已修复。必须用 ALB 替换传统 AWS ELB。

相关内容