Spamassassin + Gmail + Mbox

Spamassassin + Gmail + Mbox

如果我给sa-learnMaildir 邮件训练它作为垃圾邮件,它会毫无问题地接受它们,但是当我尝试使用包含来自我个人 Gmail 帐户的垃圾邮件的 mbox 文件时(使用https://takeout.google.com/settings/takeout/custom/gmail),它不喜欢它:

$ grep -c '^From ' spam.mbox
390

$ sa-learn --progress --no-sync --spam --mbox spam.mbox
Learned tokens from 0 message(s) (0 message(s) examined)

因此,很明显spam.mbox包含电子邮件(实际上有 390 封),但出于某种原因sa-learn决定忽略它们。

这里到底发生了什么事?

答案1

这可能不是最理想的,但我能够通过使用 Thunderbird 而不是 Google Takeout 实用程序导出我的 Gmail 垃圾邮件文件夹来让 sa-learn 正常工作。看来 GTakeout 的 mbox 格式有些奇怪,给 SA 带来了麻烦。

要使用 Thunderbird 导出您的 Gmail 垃圾邮件文件夹,请按照以下步骤操作:

  1. 安装 Thunderbird 并使用默认设置将其连接到您的 Gmail 帐户
  2. 安装进出口工具Thunderbird 的附加组件。从页面底部下载 .xpi 文件,转到 Thunderbird->工具->附加组件,单击设置齿轮,然后单击“从文件安装附加组件”。选择 .xpi 文件。(您可能需要按 Alt 才能显示“工具”菜单。)
  3. 右键单击垃圾邮件文件夹 -> ImportExportTools -> 导出远程文件夹

导出的 mbox 文件应该可以与 sa-learn 很好地配合使用。

相关内容