答案1
DOC 文件(应该)是一种“遗留”格式。有时 DOC 文件是二进制格式,有时 DOC 文件是带有 Word 扩展名的纯文本 RTF。
DOCX 文件是纯文本 XML 和其他数据(例如图像)存储在文件夹树中,压缩并以 zip 格式存储。您可以将扩展名更改为 ZIP,然后打开它们。(方便提取图像)。
如果您使用“另存为”,Windows 上的 Word 2010 只会将文件的扩展名更改为 DOC,但它仍然是一个压缩的 DOCX 文件。
如果将其保存为 RTF,您可能能够在 Windows 环境中重现该行为。
我使用古腾堡计划中随机选取的一本书中的一页文本进行了测试:
- RTF = 205KB
- DOCX = 25KB
- 使用第三方软件压缩的 RTF = 31KB
所以我最好的猜测是文件大小的差异是由于 ZIP 压缩造成的。
受保护的视图?也许文件已损坏,也许您嵌入了 VBA 宏,并且他们对宏策略进行了 100% 锁定,谁知道呢。我会单独问这个问题。