是否有适用于所有文件类型(包括 MS Office、PDF 等)的类似 grep/ack/grin 的工具?我经常发现自己想在文件夹或整个磁盘中搜索文件内的字符串,而不仅仅是纯文本。
我对 OSX 解决方案特别感兴趣,尽管我对跨平台和 UNIX/Windows 解决方案也感兴趣(但程度较轻)。
谢谢。
答案1
答案2
我不知道有哪个实用程序可以处理所有事情,但有一些有用的选项:
- 字符串(来自 binutils 包)
- lesspipe (来自 less 包)
- 反词
- odt转txt
- pdftotext (来自 poppler-utils)
其他任何事情,您可能需要运行 /usr/bin/file 并查看是否可以找到一个包,让您将其转换为您知道如何处理的某种规范格式。
答案3
不,所有文件类型和文本编码的集合太大,单个程序无法解析它们全部。
例如
- Amiga Noisetracker mod 文件格式(包含乐器名称等)
- IBM VSAM 文件包含 EBCDIC?
- OS/2 Lotus Notes 文件(加密)