网站上可下载文件列表

网站上可下载文件列表

有没有办法列出特定网站上所有可下载的文件(甚至在特定级别)?

我的典型问题是:作者toto.pdf在他的网站上发布预印本,然后论文发表后,作者删除(或重定向)链接到他的文件中index.html,但将文件本身保留在公共文件夹中。

如果您知道该名称,toto.pdf您仍然可以下载它,但是如果您没有链接(或者例如您忘记了名称)怎么办?

答案1

如果您知道扩展名(在本例中为 pdf),Google 可以帮助您,请使用查询

filetype:pdf site:google.com

将 google.com 替换为您要搜索 pdf 的网站。

例子关联

答案2

这取决于 HTTP 服务器的配置方式,可以在每个目录级别和/或全局进行配置(在大多数 HTTPd 下)。

如果服务器配置允许,您只需在地址栏中输入目录的 URL 即可浏览目录的内容。目录的地址与文件的 URL 相同(通常如此,但我们先不考虑 URL 重写),但不包括文件名。例如,http://www.example.com/files/Form0123.pdf位于目录中http://www.example.com/files/。如果服务器配置为这样做,则default index当请求没有明确索引文件的目录时,它可能显示一个页面。default index从字面上看,可以是任何东西,但通常是目录内容的列表。

浏览目录 URL 可能会产生多种结果。首先,您可能会收到错误消息,404 或 403。在这种情况下,服务器配置为default index如果未指定目录的索引,则拒绝访问目录。其他配置将产生不同的结果,并且要知道给定 URL 会发生什么,唯一的方法是尝试一下并看看。

相关内容