如何将非常大的 HTML 文件转换为 Word 并避免文档过度膨胀

如何将非常大的 HTML 文件转换为 Word 并避免文档过度膨胀

我需要将一些非常大的 HTML 文件(约 800KB,PDF 相当于约 30 页)转换为 MS Word。这在某种程度上很容易:只需在 Word 中打开并重新保存为 docx。问题是,生成的 Word 文档超过 3MB,需要十分钟才能打开。它几乎无法使用。

一个问题可能是——HTML 有大量的表单元素,而转换后的 Word 文档会尝试让它们保持活动状态(例如,单选按钮集继续像在 Web 浏览器中一样运行)。这没有必要。如果将它们转换为静态内容就没问题了。Word 文档的目的只是为审阅者提供一种方便的格式来审阅和评论文本部分。

是否有人知道————一种方法可以全局禁用 Word 文档中的所有表单元素,或将它们转换为某些静态等效图像或其他什么?——一种将 HTML 转换为 Word 并省略导致文档膨胀的功能的实用程序?——还有其他技巧可以减少在 Word 中打开的大型 HTML 文件中的超级膨胀?

相关内容