解码 MS Word 2003 文件

解码 MS Word 2003 文件

我收集了一些 15 年前使用 MS Word 2003 生成的文件(不是我生成的),我想恢复它们的内容。我已经尝试了一些显而易见的方法,它们都产生了乱码:Libre Office 和 MS Word Reader。我对一个文件进行了十六进制转储,并从前八个字节验证了它确实是 MS Word 2003。我还可以通过扫描十六进制转储找到一些单词,如“HYPERLINK”和“light”。但这是我能得到的最多信息;转储的其余部分只是随机字符或模式,如“0123456789”。

回复评论:

“file filename” 返回“Composite Document File V2 Document,无法读取部分信息”,并且 abiword 说它无法读取该文档。“strings” 产生了一些词,例如“Lightworks”、“camera”和“Raytrace”,但我怀疑它们是否与原始文件的内容有任何关系。

有没有什么 Linux 工具可以帮助我?我认为既然 MS Word Reader 没有帮助,那么在 Windows 下尝试这项工作也不会有任何更好的效果,而且我更喜欢在 Linux 上工作(实际上是 Kubuntu 18.04)。

有任何想法吗?

答案1

您可以使用工具类检查它们,例如olebrowse path/to/file。使用 安装它pip install oletools

oletools除了 之外,还有更多附带的二进制文件olebrowse。更多信息请参见链接。

相关内容