我收到一个包含制表符分隔字段的 .txt 文件。该文件包含 65K 多条记录。
我想编辑文件,删除一些记录。具体来说,我想查找所有包含特定单词(比如“taffy”)的记录。该字段可能(也可能不)以“taffy”开头,它可能是字段中的第 2 个或第 3 个单词。
我已将此 .txt 文件作为电子表格导入 Apple Numbers,但很乐意使用数据库应用程序(免费或便宜)来执行此操作。
最终结果将用作一个简单的查找表,可以是电子表格或数据库文件。
什么应用程序允许我搜索此文件并根据结果(其中一个字段包含“taffy”)对记录进行分组,以便可以多次选择和删除它们?
也许我正在寻找一个允许在搜索功能中使用布尔或正则表达式的应用程序?并且可以根据搜索结果对记录进行分组。
谢谢,
答案1
启动终端并使用命令grep过滤不包含“Taffy”的行,如下所示:
grep --invert --no-filename taffy input_file.txt > output_file.txt
这将为您生成一个新文件 ( output_file.txt
),其中不包含 taffy 的行。
另一个有用的选项可能是--ignore-case
选项。
解释:
--invert
选择线条不是包含搜索表达式--no-filename
禁止将文件名作为输出的一部分--ignore-case
忽略搜索字符串的大小写;Taffy、tAfFy、taffy 和 TAFFY 均匹配。- 将
>
命令的输出重定向到文件。