在超过 10 个大型 CSV 文件(每个 250mb)中搜索字符串(文本)的最佳方法

在超过 10 个大型 CSV 文件(每个 250mb)中搜索字符串(文本)的最佳方法

我想知道在 10 多个大型 .csv 文件中搜索特定文本或字符串的最佳方法或工具是什么。每个文件大小为 250mb。

我的想法是编写一个 powershell 脚本,因为我喜欢自制的东西,另一方面,可能已经有一个完美的工具,而我只是浪费时间 :)

答案1

您可以尝试以下版本Grep

Grep 是一个命令行实用程序,用于在纯文本数据集中搜索与正则表达式匹配的行。

JdeBP 的回答列出了许多 Windows 版本的 Grep。

我喜欢并使用赛格威工具集 ...

答案2

PowerShell 具有选择字符串它将在文本文件中搜索正则表达式:

Get-Item path\to\*.csv | Select-String -Pattern <string>

您可以使用-SimpleMatch开关来搜索文字字符串。所有符合搜索模式的行都会显示出来。

如果你想进行更高级的过滤,你也可以使用导入-Csv将 CSV 文件转换为对象,并为每个列添加属性。

相关内容