将循环转换为单行命令以提高 HP-UX 中的 shell 脚本性能

Question

while read line; do
    bytes=` echo $line | wc -c `
done

这可能是缓慢的部分，您正在为每个输入行运行外部命令。

在 ksh 中，您只需使用即可${#line}获取该变量中字符串的长度。但请注意，如果您有多字节字符，shell 可能会为每个整体计数一个特点，同时wc -c每数一字节。添加LC_ALL=C以使脚本使用 C 语言环境，这将导致对所有单独的字节进行计数。

然而，shell 可能不是最快或最好的工具。如果我没看错你的脚本，你想删除超过 3000 个字符的行。你可以这样做grep（这应该是标准的 BRE）：

grep -e '^.\{0,300\}$' "$file"

或使用 awk：

awk 'length <= 3000' "$file"

同样，如果您想计算字节数，则使用 C 语言环境应该会有所帮助：LC_ALL=C awk ...。

Answer 1

while read line; do
    bytes=` echo $line | wc -c `
done

这可能是缓慢的部分，您正在为每个输入行运行外部命令。

在 ksh 中，您只需使用即可${#line}获取该变量中字符串的长度。但请注意，如果您有多字节字符，shell 可能会为每个整体计数一个特点，同时wc -c每数一字节。添加LC_ALL=C以使脚本使用 C 语言环境，这将导致对所有单独的字节进行计数。

然而，shell 可能不是最快或最好的工具。如果我没看错你的脚本，你想删除超过 3000 个字符的行。你可以这样做grep（这应该是标准的 BRE）：

grep -e '^.\{0,300\}$' "$file"

或使用 awk：

awk 'length <= 3000' "$file"

同样，如果您想计算字节数，则使用 C 语言环境应该会有所帮助：LC_ALL=C awk ...。

相关内容