在过去的几天里,我收到了很多针对我的服务器上不存在的页面的请求。
令人担心的是,当我查看为我的网站建立的 404 错误日志时,这些请求似乎掩盖了我的服务器名称:当询问CGI.SERVER_NAME
(这是 ColdFusion 相当于 PHP 的$_SERVER['SERVER_NAME']
)时,它不会按预期返回我的服务器名称,而是返回其他外部域名(其中一些来自某种“狡猾”的网站)。
查看 apache 的访问日志,所有请求都遵循相同的模式:
[root@myserver]# grep DAPPER-HOST-IP access_log | head -n 1
XXX.XX.XXX.XX - - [30/Sep/2013:02:11:28 +0100] "GET
/page-completely-unrelated-to-my-website.cfm HTTP/1.1" 404 1826 "-"
"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1)DAPPER-HOST-IP:YY.YYY.YY.YYY"
其中XXX.XX.XXX.XX
始终是某个搜索引擎的 IP(我并不特别热衷于保留)。用户代理始终具有字符串“DAPPER-HOST-IP”,并且YY.YYY.YY.YYY
始终是不同的随机 IP,与我的服务器和上述搜索引擎都无关。我怀疑这个 IP 与服务器名称掩码问题有关。
我唯一采取的措施是封锁部分搜索引擎的 IP。我希望这足够了,但我仍然担心我的服务器中生成的某些请求看起来像是来自其他服务器。
如果有任何其他建议,我将不胜感激。到目前为止,我在网上找到的唯一有用的参考资料是: http://www.webmasterworld.com/search_engine_spiders/4612980.htm
答案1
这与将任何随机域名(通过 DNS 或 hosts 文件)指向服务器的 IP 地址的效果相同。例如,如果我为 www.example.com 设置 A 记录,将其指向 XXX.XX.XXX.XX,然后转到 www.example.com,则“www.example.com”将在错误日志中显示为主机。
任何人都无法猜测这个流氓或配置错误的机器人的目的是什么,但除了在你的日志中添加一些无用的行之外,它似乎没有造成任何实际危害。
我建议配置您的 Web 服务器,以便当域指向您的服务器时,它不会提供默认虚拟主机的内容,正如我之前所述。
例如,参见https://stackoverflow.com/questions/5427379/apache-default-virtualhost。