大学讲师通常会在大学域名上拥有自己的网页并在那里共享资源。如果教授的名字是 John Smith,那么他的网站可能是 harvard.edu/~jsmith。
我想找到给定网站上的所有此类页面,即所有看起来像 website.edu/~[some_string] 的页面 - 注意波浪号。原因是我正在寻找一些我知道在那里但不知道共享者姓名的资源。
我已经尝试过了:
谷歌搜索。效果不是很好,因为有一次我偶然发现了我正在寻找的东西,但它是通过这个域名上的另一个网页上的超链接找到的,而我之前搜索它时谷歌并没有返回它——也许它根本没有被索引,我不确定。
使用 Google 搜索修饰符站点:“websitename.edu/~”但是它不起作用 - 我预料到了这一点,因为这个修饰符只接受点作为分隔符。
理论上,我认为可以尝试访问所有可能的网站,形式为 website.edu/~[string],其中 [string] 是一些字符序列,并尝试所有可能性,直到字符数限制,然后保存那些不返回错误消息的链接。但一定有更简单的方法。
你有什么想法?
答案1
如果你使用 Google,这实际上非常简单:
site:http://www.cameron.edu/~
...例如列出各种教授页面。 (回答编辑过的问题>>>)注意:搜索字符串中没有引号(“”)。
8mm site:http://www.cameron.edu/~
... 显示对 8 毫米胶片感兴趣的教授,在本例中是 Matt Jenkins 博士
玩得开心!8-)