如何下载网站的文字版本?

如何下载网站的文字版本?

如何下载网站的文本版本?我需要使用 http raw 协议(例如 telnet)来下载。但是我不知道。有什么提示吗?

答案1

如果服务器仍然支持原来的HTTP协议版本

telnet www.example.com 80 | tee page.txt
get /index.html

如果服务器管理多个站点,则需要在请求前面加上主机标头。

对于较新版本的 HTTP,您需要做一些其他的事情。RFC 是一个有用的资源。

相关内容