我正在为一个志愿者组织托管一个网站。我已将该网站移至 WordPress,但情况并非一直如此。我怀疑该网站曾一度遭到严重黑客攻击。
在过去的 18 小时内,我的 Apache 错误日志文件已增长到 122 kB。记录的大多数错误都是这种形式——仅今天我的日志文件中就重复了数百次:
[Mon Nov 12 18:29:27 2012] [error] [client xx.xxx.xx.xxx] File does not exist: /home/*******/public_html/*******.org/calendar.php
[Mon Nov 12 18:29:27 2012] [error] [client xx.xxx.xx.xxx] File does not exist: /home/*******/public_html/*******.org/404.shtml
(我已验证 xx.xxx.xx.xxx 是 Google 服务器。)
我怀疑以前某个地方存在一个安全漏洞,很可能是calendar.php
,被利用了。
这些文件不再存在,但可能存在许多引用此处的反向链接,这就是为什么 googlebot 如此热衷于抓取它们。
我该如何优雅地解决这个问题?我仍然希望 Google 为该网站编制索引。我只是想以某种方式告诉它不要再查找这些文件。
答案1
这是410 已消失错误可用于。
Google 和其他搜索引擎可以利用这些信息确定 URL 不再有效并且预计永远不会再有效,因此将其从索引中删除。