我有一些索引文档文件(.doc,.docx 和 .pdf)存储在网站的文件夹中。
当我输入文件的完整地址时(例如http://www.website.com/folder1/folder2/1.doc) 访问者或任何浏览该网站的人都可以轻松下载该文件。
有什么方法可以防止这种情况发生吗?是否需要对 .htaccess 文件进行任何配置以防止这种情况发生。
另外,如果 folder2 仅包含文档文件,那么在 apache 停止运行的情况下,我该如何阻止列出此文件夹内的文件。
谢谢
答案1
您已索引文档文件,这意味着您让爬虫程序来获取您的文件,但您不希望人们输入确切的 URL 并下载它。
以下是几个例子
欢迎Googlebot,但是当没有引荐来源时,拒绝它。
SetEnvIf User-Agent "Googlebot" welcome
SetEnvIf Referer "^$" reject
order Allow,Deny
Allow from env=welcome
Deny from env=reject
(注:Referer 可以在 Web 浏览器中明确禁用,并且还有许多其他方法可以获取文件,而不必在浏览器中输入确切的 URL。)
答案2
为了防止访问某些特定文件,使用 htaccess,您可以写入以下内容:
<files 1.doc>
order allow,deny
deny from all
</files>
在您的.htaccess 中,位于包含 1.doc 的目录中。
如果您想全面阻止访问特定文件类型,您可以使用:
<FilesMatch "\.(doc|pdf)$">
Order Allow,Deny
Deny from all
</FilesMatch>
您可以编辑括号内的列表以满足您的需要。
有关 htaccess 的更多功能,请参见以下内容:http://perishablepress.com/press/2006/01/10/stupid-htaccess-tricks/
关于“如果 Apache 停止运行,我该如何阻止列出此文件夹内的文件。“,我不太明白你的意思...如果 Apache 停止运行,就没有人可以访问任何东西!