在尝试配置 DansGuardian 时,我很难阻止某些搜索网站,尽管不同浏览器之间也存在差异。
我使用单词“twerk”进行测试,因为捆绑的 DansGuardian 列表中没有该单词的实例。我已将以下几行添加到文件中:
列表/bannedregexpurllist: (^|[\?+=&/])(.*=twerk.*)([\?+=&/]|$)
列表 / 短语列表 / 色情 / 加权:
<twerk><40>
<twerk>,<booty><80>
dansguardian.conf: weightedphrasemode = 1 # cumulative from phrase occurances
URL 中包含单词“twerk”的网站应该被屏蔽,以及包含该单词的几个网站的网址(我的淘气极限存在160)这应该会阻止所有此类网站。
我尝试过的所有网站(除了少数搜索引擎外)都被屏蔽了。以下搜索引擎会出现故障:
其中一些需要某些浏览器才能运行(Chrome 是最糟糕的),而其他一些,比如 DuckDuckGo,甚至可以加载一个充满 twerk 相关链接的页面电子链接。
这个问题不仅仅出现在“twerk”这个词上。所有本来会被屏蔽的词都会出现这个问题。
那么为什么 DansGuardian 不过滤这些页面?我该如何让它按预期工作?
我(几乎)确信 Squid 和 Dansguardian 运行正常。在其他所有情况下(我测试过)阻止功能都有效。如果有帮助,我正在运行 Arch Linux 并使用DansGuardian ArchWiki 页面作为我的向导。
答案1
页面很可能是使用 JavaScript 分部分加载的。这使得那些搜索引擎更难根据内容进行拦截。