针对 HTTP 请求优化操作系统

Question 1

这是一个经过充分研究的问题（“高性能网络爬行”），有大量可用的研究：http://scholar.google.com/scholar?q=web+crawling+performance...是的，我作弊了，但老实说，你应该先看一下文献。

根据我过去构建此类系统的经验：你无法超越光速，所以无论如何你都会遇到这种情况。你可以做的是优化安排资源获取的方式和时间。例如，你可以优化子系统来处理问题的部分内容 - 例如 DNS 解析。你可以预先解析名称并直接连接到 IP 地址（只需添加正确的主机标头）。之后，你将不得不承担 TCP 连接成本，没有办法绕过它。也就是说，如果你对同一主机有多个请求，那么你可以利用它在现有连接上序列化多个请求：这有助于摊销 TCP/TLS 握手成本并为你提供更好的端到端性能。从那里，你必须向上移动协议阶梯：有时你可以跟踪重定向链并记住最后的位置以跳过将来的额外重定向（只需有一个后备）。事实上，这同样适用于 DNS。你可以实施一个乐观策略并直接连接到 IP，然后在失败时使用后备。对于 TLS，您可以存储会话票证和其他元数据以获得更快的重新连接（也就是说，假设您足够频繁地重新连接）。

总结：我在这里没有添加任何新内容，所有上述技巧（以及更多）都已在现有研究中涵盖。喝杯咖啡，花点时间阅读现有论文！

Answer

这是一个经过充分研究的问题（“高性能网络爬行”），有大量可用的研究：http://scholar.google.com/scholar?q=web+crawling+performance...是的，我作弊了，但老实说，你应该先看一下文献。

根据我过去构建此类系统的经验：你无法超越光速，所以无论如何你都会遇到这种情况。你可以做的是优化安排资源获取的方式和时间。例如，你可以优化子系统来处理问题的部分内容 - 例如 DNS 解析。你可以预先解析名称并直接连接到 IP 地址（只需添加正确的主机标头）。之后，你将不得不承担 TCP 连接成本，没有办法绕过它。也就是说，如果你对同一主机有多个请求，那么你可以利用它在现有连接上序列化多个请求：这有助于摊销 TCP/TLS 握手成本并为你提供更好的端到端性能。从那里，你必须向上移动协议阶梯：有时你可以跟踪重定向链并记住最后的位置以跳过将来的额外重定向（只需有一个后备）。事实上，这同样适用于 DNS。你可以实施一个乐观策略并直接连接到 IP，然后在失败时使用后备。对于 TLS，您可以存储会话票证和其他元数据以获得更快的重新连接（也就是说，假设您足够频繁地重新连接）。

总结：我在这里没有添加任何新内容，所有上述技巧（以及更多）都已在现有研究中涵盖。喝杯咖啡，花点时间阅读现有论文！

Question 2

我不知道您的 http 请求发往何处，但您可以查看相关的网络服务器是否支持 SPDY。

由 Google 开发，快闪记忆体尝试通过管道传输多个 https 请求，以获得更大的吞吐量和更低的延迟。

我也赞同上述有关 DNS 优化的任何建议。您确实需要设置缓存转发 DNS 来加快速度。如果您可以控制 Web 服务器的 TTL，那么在您觉得合适的范围内增加 TTL 是值得的。

Answer

我不知道您的 http 请求发往何处，但您可以查看相关的网络服务器是否支持 SPDY。

由 Google 开发，快闪记忆体尝试通过管道传输多个 https 请求，以获得更大的吞吐量和更低的延迟。

我也赞同上述有关 DNS 优化的任何建议。您确实需要设置缓存转发 DNS 来加快速度。如果您可以控制 Web 服务器的 TTL，那么在您觉得合适的范围内增加 TTL 是值得的。

针对 HTTP 请求优化操作系统

答案1

答案2

相关内容