我有视力问题,用 TTS 阅读电子书。但很多电子书只有 PDF 格式,而 PDF 在转换为 ePub 时会因为页眉和页脚而变得非常糟糕。
然后我发现了一款名为 BRISS 的 FOSS 软件,它可以裁剪 PDF 以删除页眉和页脚,还具有高级提取功能。我欣喜若狂。但在将 PDF 转换为 ePub 后,我意识到 BRISS 只会隐藏裁剪之外的数据,而不会删除它。当裁剪后的 PDF 转换为 ePub 时,PDF 中不可见的页眉和页脚将在 ePub 中可见。
有没有一种软件可以销毁 PDF 中视图之外的所有文本,而不仅仅是隐藏它们?我不想在 Calibre 中摆弄正则表达式。
我想,如果有软件可以进行破坏性裁剪,那么我可以将裁剪(BRISS 裁剪文件)设置为较小的量,这样视野之外的所有内容都会被破坏
答案1
我找到了一个解决方案,虽然是付费的。仍然希望有一个免费的解决方案。
首先使用 BRISS 进行裁剪。
下一步涉及使用 Adobe Acrobat Pro。
- 在 Acrobat Pro 中,转到工具。
Redact
在 下添加Protect and Standardize
。 - 打开 BRISS 裁剪的 PDF,然后单击软件右侧的“编辑”按钮。只有
Redact
从“工具”中添加后才会显示。 - 然后单击
Santize Document
,再单击OK
。这将删除所有隐藏数据。
TL;DR:首先使用 BRISS 进行裁剪,然后使用Santizie document
Adob Redact
e Acrobat Pro 中的工具。这将删除所有隐藏内容(由 BRISS 隐藏)。
然后将电子书转换为ePub。