我正在使用 Java 的 Smooks 框架,在加载 Word 文档时遇到问题。该文档来自非英语来源,我需要弄清楚字符编码是什么。Word 2010 中是否有地方可以告诉您文件使用的编码?
答案1
Word 文档具有特定格式,不同版本的 Word 文档格式不同。没有单独的字符编码声明。具体来说,Word 2010 使用基于 XML 的特殊格式,隐含 UTF-8 编码。
我正在使用 Java 的 Smooks 框架,在加载 Word 文档时遇到问题。该文档来自非英语来源,我需要弄清楚字符编码是什么。Word 2010 中是否有地方可以告诉您文件使用的编码?
Word 文档具有特定格式,不同版本的 Word 文档格式不同。没有单独的字符编码声明。具体来说,Word 2010 使用基于 XML 的特殊格式,隐含 UTF-8 编码。