我们正在将大量旧的 HTML 格式的新闻稿转换为 PDF 格式,以便长期存档。我们希望确保生成的 PDF 可以访问。我们使用 Adobe Acrobat DC 来生成 PDF。
当转换设置中的“创建 PDF 标签”选项启用时,使用 Acrobat 的内部转换器(文件 > 创建 > 从网页创建 PDF)可以获取大量 HTML 标记。但是,它似乎无法识别 HTML 源代码中链接的图像的 ALT 文本。
我们不想在创建 PDF 后手动更正成百上千张图像的 ALT 文本。特别是因为其中许多都是重复的装饰元素,我们可以通过对原始 HTML 运行搜索和替换操作更轻松地修复它们。
那么,有没有什么方法可以让 Acrobat DC 保留网页的 ALT 文本?我尝试通过 Google 寻找答案,但没有成功。
如果有更好的选择,我们也许会考虑使用不同的软件。