有没有办法列出特定网站上所有可下载的文件(甚至在特定级别)?
我的典型问题是:作者toto.pdf
在他的网站上发布预印本,然后论文发表后,作者删除(或重定向)链接到他的文件中index.html
,但将文件本身保留在公共文件夹中。
如果您知道该名称,toto.pdf
您仍然可以下载它,但是如果您没有链接(或者例如您忘记了名称)怎么办?
答案1
如果您知道扩展名(在本例中为 pdf),Google 可以帮助您,请使用查询
filetype:pdf site:google.com
将 google.com 替换为您要搜索 pdf 的网站。
例子关联
答案2
这取决于 HTTP 服务器的配置方式,可以在每个目录级别和/或全局进行配置(在大多数 HTTPd 下)。
如果服务器配置允许,您只需在地址栏中输入目录的 URL 即可浏览目录的内容。目录的地址与文件的 URL 相同(通常如此,但我们先不考虑 URL 重写),但不包括文件名。例如,http://www.example.com/files/Form0123.pdf
位于目录中http://www.example.com/files/
。如果服务器配置为这样做,则default index
当请求没有明确索引文件的目录时,它可能显示一个页面。default index
从字面上看,可以是任何东西,但通常是目录内容的列表。
浏览目录 URL 可能会产生多种结果。首先,您可能会收到错误消息,404 或 403。在这种情况下,服务器配置为default index
如果未指定目录的索引,则拒绝访问目录。其他配置将产生不同的结果,并且要知道给定 URL 会发生什么,唯一的方法是尝试一下并看看。