如何在Linux终端中从长尺寸的csv文件中分离数据？

Question

grep已经是一种非常快速的方式来浏览大文件并在行中查找单词或字符，也许单词-w正则表达式使它有点慢。通常速度慢的并不是其grep本身，而是终端上的输出。您可以通过将输出定向到文件来简单地测试它：

grep -w "for-outbound-sports\|2019-05-16" Master.csv > greped_master.csv

您始终可以使用该程序parallel来分割大文件并利用多线程。如 parallel --pipe --block 2M grep foo < bigfile 你所见这里

Answer 1

grep已经是一种非常快速的方式来浏览大文件并在行中查找单词或字符，也许单词-w正则表达式使它有点慢。通常速度慢的并不是其grep本身，而是终端上的输出。您可以通过将输出定向到文件来简单地测试它：

grep -w "for-outbound-sports\|2019-05-16" Master.csv > greped_master.csv

您始终可以使用该程序parallel来分割大文件并利用多线程。如 parallel --pipe --block 2M grep foo < bigfile 你所见这里

相关内容