我正在一堆 pdf 上运行 pdftotext,其中一些抛出了这个错误:
Error: Illegal entry in bfchar block in ToUnicode CMap
我查看了输出文件,它们看起来没什么问题,所以我不确定这是否是一个重大错误,但我很担心。有人知道这个错误是什么、是什么原因造成的以及会造成多大的损失吗?
答案1
似乎无法将字符转换为 unicode 等效字符。我猜这不会造成太大的损害,而且这可能是由仅使用 ASCII 编码的 PDF 造成的。
我正在一堆 pdf 上运行 pdftotext,其中一些抛出了这个错误:
Error: Illegal entry in bfchar block in ToUnicode CMap
我查看了输出文件,它们看起来没什么问题,所以我不确定这是否是一个重大错误,但我很担心。有人知道这个错误是什么、是什么原因造成的以及会造成多大的损失吗?
似乎无法将字符转换为 unicode 等效字符。我猜这不会造成太大的损害,而且这可能是由仅使用 ASCII 编码的 PDF 造成的。