将 RTF/Word 保存为自包含 HTML 文件

将 RTF/Word 保存为自包含 HTML 文件

有没有办法将 Word 文档另存为单身的HTML 文件,自包含的网页,将所有图片嵌入 encode64 或类似内容中?

当我说单一时,它的意思是,作为输出,我们将只有一个 HTML 文件,打开该文件将显示我们的格式化文本和嵌入的图片(如果有)。

我需要将 RTF 文件转换为可以在 SharePoint 中的 richTextFormat 字段中加载的内容...所以我需要类似

this is some <b>bold</b> text and a picture: 
<img src="data:image/png;base64,...>

答案1

在 Office 365 中(可能在旧版本中也是如此),您可以将文件保存为包含所有图像和文本的“单个文件网页”。请注意,使用此格式时,复杂的格式将丢失。

答案2

需要完成一些手工工作。

Word 可以将文档保存为 HTML 格式,尽管生成的 HTML 并不美观、冗长且难以理解。第三方实用程序可能做得更好,但根据我的经验,我不推荐使用。

要将图像转换为其 base64 编码,请在命令提示符 (cmd) 中执行以下操作:

cd image-folder
certutil -encode mypicture.png mypicture.txt

以上方法也适用于 JPEG 图像。

在文本编辑器中打开生成的文本文件,删除“-----BEGIN CERTIFICATE-----”和“-----END CERTIFICATE-----”的括起来的行,然后将所有行合并为一个连续的数据行,其中没有嵌入空格。

现在在文本编辑器中打开 HTML 文件,找到图像条目 <img src="mypicture.png">,并将其替换为:

保留<img>标签的其他属性(如果有)。

对于 JPEG 图像(.jpg.jpeg),使用image/jpeg而不是image/png

请注意,此过程仅适用于相对较小的图像,并确保您的文本编辑器可以处理非常长的行。

相关内容