sed 或 grep 与 vfF 的其他等效项

Question 1

使用awk，确保您只在这些字符串应该在的地方查找它们。

awk '!source {stem[$0]; next}
     ! (substr($0, 225, 13) in stem)
     ' stem.txt source=1 source.txt > filteredoutput.txt

（substr()起始位置从 1 开始）。

这也将使其更加高效，因为它只需要每行执行一次哈希查找，source.txt而不是 4.5k 次子字符串查找。

注意

grep -vfF stem.txt source.txt

是

grep -v -f F stem.txt source.txt

（查找文件中不匹配任何正则表达式stem.txt的行）。source.txtF

你的意思可能是：

grep -vFf stem.txt source.txt

（查找source.txt不包含中任何字符串的行stem.txt）。

Answer

使用awk，确保您只在这些字符串应该在的地方查找它们。

awk '!source {stem[$0]; next}
     ! (substr($0, 225, 13) in stem)
     ' stem.txt source=1 source.txt > filteredoutput.txt

（substr()起始位置从 1 开始）。

这也将使其更加高效，因为它只需要每行执行一次哈希查找，source.txt而不是 4.5k 次子字符串查找。

注意

grep -vfF stem.txt source.txt

是

grep -v -f F stem.txt source.txt

（查找文件中不匹配任何正则表达式stem.txt的行）。source.txtF

你的意思可能是：

grep -vFf stem.txt source.txt

（查找source.txt不包含中任何字符串的行stem.txt）。

Question 2

另一种方法是动态创建 ERE，在、的帮助下从第 225 个位置开始匹配，sed对于grep这些 ERE：

grep -vEf <(sed 's/.*/^.{224}&/' stem.txt) source.txt

因此，匹配需要从特定位置开始，以防止随机位置中任何其他可能的匹配影响输出。

grep您还可以通过运行without-v并将结果与进行比较来测试其他位置是否有匹配项stem.txt。

Answer

另一种方法是动态创建 ERE，在、的帮助下从第 225 个位置开始匹配，sed对于grep这些 ERE：

grep -vEf <(sed 's/.*/^.{224}&/' stem.txt) source.txt

因此，匹配需要从特定位置开始，以防止随机位置中任何其他可能的匹配影响输出。

grep您还可以通过运行without-v并将结果与进行比较来测试其他位置是否有匹配项stem.txt。

相关内容