pdftotext - 错误:ToUnicode CMap 中的 bfchar 块中的非法条目

pdftotext - 错误:ToUnicode CMap 中的 bfchar 块中的非法条目

我正在一堆 pdf 上运行 pdftotext,其中一些抛出了这个错误:

Error: Illegal entry in bfchar block in ToUnicode CMap

我查看了输出文件,它们看起来没什么问题,所以我不确定这是否是一个重大错误,但我很担心。有人知道这个错误是什么、是什么原因造成的以及会造成多大的损失吗?

答案1

似乎无法将字符转换为 unicode 等效字符。我猜这不会造成太大的损害,而且这可能是由仅使用 ASCII 编码的 PDF 造成的。

相关内容