有没有办法将 Word 文档另存为单身的HTML 文件,自包含的网页,将所有图片嵌入 encode64 或类似内容中?
当我说单一时,它的意思是,作为输出,我们将只有一个 HTML 文件,打开该文件将显示我们的格式化文本和嵌入的图片(如果有)。
我需要将 RTF 文件转换为可以在 SharePoint 中的 richTextFormat 字段中加载的内容...所以我需要类似
this is some <b>bold</b> text and a picture:
<img src="data:image/png;base64,...>
答案1
在 Office 365 中(可能在旧版本中也是如此),您可以将文件保存为包含所有图像和文本的“单个文件网页”。请注意,使用此格式时,复杂的格式将丢失。
答案2
需要完成一些手工工作。
Word 可以将文档保存为 HTML 格式,尽管生成的 HTML 并不美观、冗长且难以理解。第三方实用程序可能做得更好,但根据我的经验,我不推荐使用。
要将图像转换为其 base64 编码,请在命令提示符 (cmd) 中执行以下操作:
cd image-folder
certutil -encode mypicture.png mypicture.txt
以上方法也适用于 JPEG 图像。
在文本编辑器中打开生成的文本文件,删除“-----BEGIN CERTIFICATE-----”和“-----END CERTIFICATE-----”的括起来的行,然后将所有行合并为一个连续的数据行,其中没有嵌入空格。
现在在文本编辑器中打开 HTML 文件,找到图像条目
<img src="mypicture.png">
,并将其替换为:
保留<img>
标签的其他属性(如果有)。
对于 JPEG 图像(.jpg
或.jpeg
),使用image/jpeg
而不是image/png
。
请注意,此过程仅适用于相对较小的图像,并确保您的文本编辑器可以处理非常长的行。