![如果学习到的垃圾邮件主题中包含 *SPAM*,spamassassin 的贝叶斯过滤器是否会起作用?](https://linux22.com/image/662473/%E5%A6%82%E6%9E%9C%E5%AD%A6%E4%B9%A0%E5%88%B0%E7%9A%84%E5%9E%83%E5%9C%BE%E9%82%AE%E4%BB%B6%E4%B8%BB%E9%A2%98%E4%B8%AD%E5%8C%85%E5%90%AB%20*SPAM*%EF%BC%8Cspamassassin%20%E7%9A%84%E8%B4%9D%E5%8F%B6%E6%96%AF%E8%BF%87%E6%BB%A4%E5%99%A8%E6%98%AF%E5%90%A6%E4%BC%9A%E8%B5%B7%E4%BD%9C%E7%94%A8%EF%BC%9F.png)
当我的邮件设置检测到邮件是垃圾邮件时,它会将其添加*SPAM*
到主题中。现在我想通过在我的垃圾邮件语料库上训练贝叶斯过滤器来改进它。
如果我将这些数千封邮件发送给sa-learn
,即使它们的主题中仍有 ,这是否*SPAM*
有效?或者它是否会告诉过滤器“只有标题中包含 ,才是垃圾邮件*SPAM*
”,这会适得其反吗?
答案1
根据手册页对于sa-learn
,这样就没问题了。
如果您要学习的邮件已经通过 SpamAssassin 过滤,学习器将对此进行补偿。实际上,如果您事先对每封邮件运行 spamassassin -d,它会学习每封邮件的样子。