如何将 .eml 文件转换为 PDF?

如何将 .eml 文件转换为 PDF?

我有近 300 封 .eml 格式的电子邮件需要转换或打印为 PDF 以用于法律目的。因此,我有一些非常具体的需求:

  1. 必须有页码。
  2. 不能有其他页眉/页脚(尤其是路径或当前日期)。
  3. 打印输出中不得显示密件抄送收件人。
  4. 必须至少有收件人、发件人、抄送和主题。
  5. 不得在顶部显示用户/个人资料/帐户名称(类似 Microsoft Outlook 备忘录样式)
  6. 文件名必须是电子邮件的主题,并插入或附加某种唯一索引以防止覆盖。

我到目前为止已经尝试过的(以及为什么它不起作用):

  1. 从 Outlook 打印为 PDF。打印时总是在顶部显示我的名字。我在家里偶然发现,如果您打开未设置帐户的文件,则可以单独打印它们而无需命名。但似乎没有任何方法将它们导入 Outlook 本身以一次打印所有文件,或者至少批量打印而不是一次打印。即使我倾向于一次打印一个,Outlook 似乎默认的打印到文件作业的作业名称/文件名是“Microsoft Outlook - 备忘录样式”,这不好。

    附注:我在家里有三种不同的 PDF 打印机:Microsoft Print to PDF、Foxit Reader 和 PDFCreator。MSPTP 根本不提供默认文件名,其他两个使用我上面提到的文件名。

  2. 使用 importexporttools 插件将它们导入 Thunderbird 本地文件夹。这可能是我最好的选择,但让我抓狂的问题是应该能够再次使用 importexporttools 将文件全部保存为 PDF,但以这种方式保存为 PDF 的任何文件都有默认的页眉/页脚。我仔细检查了配置文件并在 Tbird 内部和外部进行了设置,但我无论如何也找不到它从哪里获得该设置。另一种方法是逐个保存所有 300 个。但即使我愿意这样做,Tbird 也会打印少量的标题(我认为它由 print.show_header = 0 上的发件人、日期、主题组成)或整个标题 - 没有中间内容。令人沮丧的是,“正常”标题(1)和完整标题(2)之间没有区别 - 它们似乎都打印完整的标题。因此,如果我选择这条路线,我将必须仔细检查并手动删除大约一半 PDF 中的任何 BCC 行,或多或少。

  3. (自原始帖子添加)将扩展名更改为 mht 并在 Internet Explorer 中打开。还尝试在 Firefox 和 Chrome 中打开。IE 看起来不错,页脚和页眉都是可格式化的,但所有电子邮件标题都完全丢失了。Firefox 甚至无法打开它,像下载一样处理它,而 Chrome 只是一行长行的正文纯文本,没有格式,也没有标题。为了涵盖所有基础,我尝试在所有三个浏览器中打开 eml 文件,但没有任何结果。

有人有主意吗?

答案1

这里EML是一款将(MIME 格式)文件转换为 的开源工具PDF。它通过以下方式实现

解析(和清理)mime/structure,将其转换为html然后使用wkhtmltopdf将生成的html转换为pdf文件。

因此,您可以根据需要调整转换为 HTML 的过程,或者在转换为 PDF 之前对生成的 HTML 文件进行后期处理。

相关内容