我想知道为什么我的消息被标记为http://isnotspam.comBAYES_99 BODY 得分为 3.5。报告显示“SpamAssassin 检查:正常邮件(非垃圾邮件)”,这很好。然而,让我困扰的是,我得到了:
3.5 BAYES_99 BODY: Bayes spam probability is 99 to 100%
0.2 BAYES_999 BODY: Bayes spam probability is 99.9 to 100%
所以是的,它并没有真正被标记为垃圾邮件,但对于 SpamAssassin BAYES 来说,它怎么可能看起来像垃圾邮件呢?我想这可能是我的 HTML 签名,或者电子邮件是以 HTML 形式发送的。因此,我尝试了一个只有 JPG 作为签名的版本,最后尝试了可以在下面的链接上访问的纯文本版本。结果仍然相同。我检查了 IP 或域是否在任何地方被列入黑名单,但一切都很清楚。我的电子邮件使用 SPF、DKIM、DMARC 签名,甚至在 dnswl.org 上被列为值得信赖。
令人沮丧的是,尽管电子邮件最有可能被送达,因为它给出的分数是 2.7,但被归类为 99% 可能的垃圾邮件仍然令人不快,我觉得 2.7 的分数仍然很高。你永远不知道其他接收服务器如何为此配置 SpamAssassin 分数。
如果有人知道还有什么需要检查的话,我将不胜感激。发送电子邮件的服务器是 CentOS 6.9,带有 Postfix、AMAVIS-New、ClamAV。我不确定这还可能是什么,请参阅下面的报告链接;这是一封纯文本电子邮件。
http://isnotspam.com/newlatestreport.php?email=ins-10xbd4u5%40isnotspam.com
答案1
你不能检查未与您共享此数据的收件人的贝叶斯数据库。这故意不公开,否则构造能够击败任何简单的贝叶斯垃圾邮件过滤器的垃圾邮件将变得更加简单。
然而,你能查看使用您有权访问的贝叶斯数据库查询的标记,并且当这些数据库之间存在相似性时(在正确设置和对类似邮件流进行训练时很可能如此),仍然可以推断出哪些标记可能相关的有用信息。
只需将您的邮件发送到垃圾邮件杀手程序指示将令牌记录到标题中。
cat message.eml | sudo -H -u debian-spamd spamassassin \
--test-mode --local --cf='bayes_auto_lean 0' \
--cf='add_header all Spam-Tokens-Spammy _SPAMMYTOKENS(20,compact)_' \
--cf='add header all Spam-Tokens-Hammy _HAMMYTOKENS(20,compact)_' | less
最好使用收到的消息,而不是发送的消息 - 最有趣的标记可能是在提交后添加的(例如中继的名称和地址)。您可以选择打印的最大标记数和格式(此处:)compact
。语法记录在doc/Mail_SpamAssassin_Conf
生成的消息将包含如下标头,列出每个标记及其各自的信号强度:
Spam-Tokens-Spammy: 0.992-+--investment, 0.988-+--estate, 0.987-+--download, ..
Spam-Tokens-Hammy: 0.000-+--0, 0.002-+--H*RU:192.0.2.1, 0.018-+--utf8, ..
在这个例子中,我们可以看出,提及“投资”,“房地产”和“下载”对将邮件归类为垃圾邮件产生了影响。