我最近开始设置和配置带有 ubuntu 14 的 Linux 机器,目的是为学校课程网络提供代理服务器。
一切进展顺利并正常运行,但我注意到一些令我担忧的事情。
为了不冒犯任何人,我不会列出网站网址(这只是一个例子),所以我将其称为
www.blockedsite.com/blockedpage
该 URL(以及其他 10000 个 URL)都在我的黑名单中,当您尝试访问该网站时,您会收到您所希望的预期的禁止/拒绝访问错误。
然而!
如果我只是输入blockedsite.com/blockedpage这样的URL(不带前导http://或www.)那么它会毫无疑问地加载页面——非常糟糕!
当然,IE 似乎不会出现这种情况,因为它总是在 URL 开头添加 https 前缀。Chrome 中也存在此问题……不幸的是,我们使用的就是 Chrome。
有人能建议如何解决这个问题吗?
詹姆斯
答案1
这些黑名单会将您的字符串与 URL 进行精确匹配。您的黑名单中可能包含“http://”或“www”,但 Google 不会添加这些内容。
证明:
我从这里
./blacklists/ads$ more urls
thisisarandomentrythatdoesnotexist.com/foo
还有其他几个。
所有这些协议的 URL 前面都没有“http”或“www.”所以答案是肯定的:www.
从黑名单中删除其前面的所有内容。原因很简单:这适用于 http、https、ftp 和许多其他协议,甚至适用于尚未发明的协议。