MS Office 365 Word 在 RTF 中产生多余的块

MS Office 365 Word 在 RTF 中产生多余的块

我创建并编辑了 2 个 RTF 文件。在每个文件中我都写了单词“test”,然后将字体设为粗体(首先是“te”,然后是“st”,分两步)

  1. 开放办公室作家

结果 rtf 块:

{
    \b\ab\rtlch \ltrch\loch\lang1033 test
}

大小:2 KiB

文本:测试


  1. 微软 Office 365 Word

结果 rtf 块:

{
    \rtlch\fcs1 \af31507 \ltrch\fcs0
    \b\lang1033\langfe2052\langnp1033\insrsid7543533\charrsid16743564
    \hich\af31506\dbch\af31505\loch\f31506 te
    \hich\af31506\dbch\af31505\loch\f31506 st
}

大小:42 KiB

文本:测试

(他用同样的格式制作了两个“\hich\af31506\dbch\af31505\loch\f31506”部分。为什么???)


请告诉我,MS Word 中出现这种冗余的原因是什么?是否可以通过 Word 最佳地导出 RTF 文件?


更新型多巴胺(解决方案@哈里麦克):

  1. 写字板

我将文本从 MS Word 复制到写字板并得到最紧凑的 RTF:

结果 rtf 块:无复制大小:255 字节

答案1

RTF 旨在成为一种文档交换格式,而不是永久存储格式。它之所以如此庞大,是因为所有内容都是 ASCII,所有格式都是通过标签等完成的。它旨在让任何程序都易于解析、导入和输出,而不是用于文字处理。

它可能不是实际使用的最佳格式选择,当转换为任何“二进制”格式(如 Word 格式)时.docx,尺寸可能会大幅缩小。

减小 RTF 文档大小的一种方法是将文本从 Word 复制粘贴到 Wordpad,然后从 Wordpad 保存。保存的文件格式会更简单、更小。

相关内容