Microsoft Word 中的 Grep?

Microsoft Word 中的 Grep?

Microsoft Word 中的 Grep?

我想从 Word 文档中提取包含给定字符串的所有行。在 Unix 世界中... grep 可以毫无问题地完成此操作。Windows 对我来说不太明显。

答案1

使用 Cygwin(或访问 Linux 机器),您可以

antiword file.doc | grep "my phrase"

或者

catdoc file.doc | grep "my phrase"

有很多命令行文件格式转换器可以grep以类似的方式。

纯粹的 Word 解决方案可能是Ctrl+F(查找),然后找到所有- 不过,我不确定是否所有版本的 MS Word 都有找到所有按钮。

答案2

我知道这听起来很原始,但是什么阻止你将文件保存为 .txt 然后根据你的喜好将其拆分开来。

答案3

没有足够的代表来发表评论,但我可以看到这个 doc 与 docx 问题被讨论,因此任何追踪该帖子的人(就像我一样)可能会发现这很有帮助。

您不需要专门用于 docx 文件的工具。docx 是压缩的 XML 文件。

要提取和剥离 XML,请尝试基于

unzip -p "*.docx" word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'

命令行功能

答案4

支持 MS 文档 - Word、PowerPoint、Excel -中科院研究生教育促进会这是我开发的一款免费开源工具。它还可以搜索其他难以搜索的内容,例如数据库表、图像、音频、档案、PDF 以及这些内容的组合。祝您玩得开心。

相关内容