我有一个 pdf 文件(500 页),里面有很多图片(黑白)。但是,文字很模糊,虽然可以阅读,但真的很麻烦(可能是硬拷贝扫描得不好,不确定)。
有什么方法可以“清理”pdf 文件?我可以用当前质量的图表来处理,因为它们很大,所以我没问题。但文本无法处理。所以理想情况下,我想创建一个具有良好文本质量的副本。
我实际上无法使用一些转换器,因为 pdf 文件中有图像(而且图像也很多)。
使用 ubuntu 14.04。
我不是开发人员。只是一名普通用户。
更新:
我再次强调,pdf 文件也有很多图片,而且文本模糊严重。不幸的是,gscan2pdf 根本不起作用。
答案1
您应该尝试使用 gscan2pdf,我的一个朋友最近在使用它,他说它很好用并且使字体可读。
以下是相同内容的链接:https://apps.ubuntu.com/cat/applications/precise/gscan2pdf/