浏览器内容与 curl 内容不同;浏览器是否以某种方式操纵它?

浏览器内容与 curl 内容不同;浏览器是否以某种方式操纵它?

我有一台装有 Ubuntu 服务器 18.04 的虚拟机,上面运行着一个带有两个虚拟主机的 apache2 网络服务器。我将一个虚拟主机配置为另一个虚拟主机的反向代理。在代理上,我使用 substitute_module 更改一些代理内容 (text/html)。作为一个简单的开始,我想通过将标题替换为“Substitute works!”来稍微更改“Apache2 Default Ubuntu Page”(index.html)。

当我在该网站上使用 curl 并检查 html 代码时,标题已更改。但是当我使用任何浏览器(Firefox/Chrome/IE)加载页面时,文档与原始文档保持不变。到目前为止,我所做的是:

  • 清空缓存;使用浏览器的网络分析工具说,它没有从缓存中收到内容

  • 检查服务器日志->我收到的通知与使用 curl 访问文档时收到的通知相同,例如:

[Fri Mar 13 18:09:43.093779 2020] [proxy:debug] [pid 3223:tid 139804452681472] proxy_util.c(2192): AH00943: http: has released connection for (127.0.0.1)
[Fri Mar 13 18:09:43.093940 2020] [filter:trace4] [pid 3223:tid 139804452681472] mod_filter.c(169): [client 10.0.2.2:50431] Content-Type 'text/html' ...
[Fri Mar 13 18:09:43.094262 2020] [filter:trace4] [pid 3223:tid 139804452681472] mod_filter.c(175): [client 10.0.2.2:50431] ... matched 'text/html'
[Fri Mar 13 18:09:43.094348 2020] [filter:trace2] [pid 3223:tid 139804452681472] mod_filter.c(188): [client 10.0.2.2:50431] Content-Type condition for 'substitute' matched

这是 curl 输出的有趣摘录:

      <div class="page_header floating_element">
        <img src="/icons/ubuntu-logo.png" alt="Ubuntu Logo" class="floating_element"/>
        <span class="floating_element">
          Substitute works!
        </span>
      </div>

这是从浏览器加载的 html 中复制的片段:

<div class="page_header floating_element">
        <img src="/icons/ubuntu-logo.png" alt="Ubuntu Logo" class="floating_element">
        <span class="floating_element">
          Apache2 Ubuntu Default Page
        </span>
      </div>

我怀疑可能是某些浏览器优化检测到了这种操作并以某种方式将其逆转了?但我对这个话题不太熟悉,所以我真的很高兴能得到任何解释/提示在哪里搜索。

如果任何配置细节有用,我会很乐意提供。

相关内容