Apache 2.2 上的 access.log 中出现奇怪的条目

Apache 2.2 上的 access.log 中出现奇怪的条目

我正在运行 Apache 2.2,我的服务器运行良好。注意到我的 access.log 文件中有这种奇怪的异常,我该如何防止它?robots.txt 似乎不起作用。

127.0.0.1 - - [17/Apr/2011:12:17:00 +0100] "GET / HTTP/1.1" 200 3022 "-" "msnbot/1.1 (+http://search.msn.com/msnbot.htm)"
127.0.0.1 - - [17/Apr/2011:12:17:00 +0100] "GET /icons/blank.gif HTTP/1.1" 200 487 "http://localhost/" "msnbot/1.1 (+http://search.msn.com/msnbot.htm)"
127.0.0.1 - - [17/Apr/2011:12:17:00 +0100] "GET /icons/layout.gif HTTP/1.1" 200 616 "http://localhost/" "msnbot/1.1 (+http://search.msn.com/msnbot.htm)"
127.0.0.1 - - [17/Apr/2011:12:17:00 +0100] "GET /icons/folder.gif HTTP/1.1" 200 564 "http://localhost/" "msnbot/1.1 (+http://search.msn.com/msnbot.htm)"
127.0.0.1 - - [17/Apr/2011:12:17:00 +0100] "GET /icons/compressed.gif HTTP/1.1" 200 1379 "http://localhost/" "msnbot/1.1 (+http://search.msn.com/msnbot.htm)"
127.0.0.1 - - [17/Apr/2011:12:17:01 +0100] "GET /icons/image2.gif HTTP/1.1" 200 650 "http://localhost/" "msnbot/1.1 (+http://search.msn.com/msnbot.htm)"

这是机器人攻击吗?还是我的服务器出了问题?我该如何修复,以防止这种情况再次发生?

答案1

您有 robots.txt 吗?

如果没有,那么你应该创建一个。你可以阅读这里

答案2

MSNbot 是 Microsoft 用于 msn/live/bing 的网络爬虫。它通常并不“危险”。如果您正确配置了 robots.txt 文件,它将拾取并遵守这些文件(请参阅 user74596 的回答)。它可能需要一两天的时间才能拾取 robots.txt 文件。

如果您希望人们能够在上面列出的搜索引擎中找到您的网站,您不应该阻止访问您的网站。

相关内容