仅计算文件特定列中的字母数字单词

Question

如果你不限制wc，你可以用sed这样的工具过滤掉数字，然后用wc统计单词数。

鉴于您的文本（在测试文件中）将给出：

$ sed -e s/[0-9]*//g testfile

不听话的树脂图形卑鄙的人恶毒的 MINIS 眨眼的申请者托皮蒂斯潜台词分配的卡片心电图机烧结的足底迷恋夏尔巴·弗兰否决新闻阅读器腐烂执行先锋朗朗一致地假装畸形牛花法官国际化讨论率逃避安全瘰疬排除核素沉船残骸序言猥琐营养减压男人气概NEGOTIANT耐嚼埃及血腥的故事更有价值咆哮的血腥不受控制的受害者双重令人厌恶着迷辉煌多变干燥粗鲁卑鄙脾气暴躁疼痛杰萨姆斯野蛮夺取倾向怡和授权游行领带希利尔乌瑟合规蔑视候选人罗斯托夫滴定字典优化IST LUT 疣 RAPINE 食人敌对 KALI 崇拜截肢取景器升级缩小否认阿尔卑斯山 Stahl HEELLESS女性主义幸运父权制反共主义

我使用的正则表达式模式有一个缺点，即数字后面的空格不会被删除，但这对于使用 wc 进行计数似乎并不重要。

使用管道过滤后，可以直接使用 wc 来统计单词数。

$ sed -e s/[0-9]*//g testfile | wc
  2     104    1035

Answer 1

如果你不限制wc，你可以用sed这样的工具过滤掉数字，然后用wc统计单词数。

鉴于您的文本（在测试文件中）将给出：

$ sed -e s/[0-9]*//g testfile

不听话的树脂图形卑鄙的人恶毒的 MINIS 眨眼的申请者托皮蒂斯潜台词分配的卡片心电图机烧结的足底迷恋夏尔巴·弗兰否决新闻阅读器腐烂执行先锋朗朗一致地假装畸形牛花法官国际化讨论率逃避安全瘰疬排除核素沉船残骸序言猥琐营养减压男人气概NEGOTIANT耐嚼埃及血腥的故事更有价值咆哮的血腥不受控制的受害者双重令人厌恶着迷辉煌多变干燥粗鲁卑鄙脾气暴躁疼痛杰萨姆斯野蛮夺取倾向怡和授权游行领带希利尔乌瑟合规蔑视候选人罗斯托夫滴定字典优化IST LUT 疣 RAPINE 食人敌对 KALI 崇拜截肢取景器升级缩小否认阿尔卑斯山 Stahl HEELLESS女性主义幸运父权制反共主义

我使用的正则表达式模式有一个缺点，即数字后面的空格不会被删除，但这对于使用 wc 进行计数似乎并不重要。

使用管道过滤后，可以直接使用 wc 来统计单词数。

$ sed -e s/[0-9]*//g testfile | wc
  2     104    1035

仅计算文件特定列中的字母数字单词

答案1

相关内容