textutil 将 PDF 转换为 txt 产生乱码输出

Question

参考TEXTUTIL(1) 手册页它似乎pdf不属于该实用程序管理的格式之间： fmt is one of: txt, html, rtf, rtfd, doc, docx, wordml, odt, or webarchive

在 Linux/Unix 上安装可编写脚本的产品，例如XPDF/pdftotext 可能是一个有效的解决方案，就像已经建议的一些评论一样。

对于 OS X 上的用户，可以通过本机 OS X 自动操作从 PDF 中提取文本（ ..看这个答案或者本教程的最后 4'）然后考虑自动化的工作流程可以通过以下方式“编写脚本”CLI 自动命令

Answer 1

参考TEXTUTIL(1) 手册页它似乎pdf不属于该实用程序管理的格式之间： fmt is one of: txt, html, rtf, rtfd, doc, docx, wordml, odt, or webarchive

在 Linux/Unix 上安装可编写脚本的产品，例如XPDF/pdftotext 可能是一个有效的解决方案，就像已经建议的一些评论一样。

对于 OS X 上的用户，可以通过本机 OS X 自动操作从 PDF 中提取文本（ ..看这个答案或者本教程的最后 4'）然后考虑自动化的工作流程可以通过以下方式“编写脚本”CLI 自动命令

相关内容