grep 中基本/扩展 posix 正则表达式字符串中元字符的转义

Question

如何引用特殊字符（可移植）

以下代码片段在扩展正则表达式中的每个特殊字符之前添加一个反斜杠，用于用后跟该字符的反斜杠sed替换任何出现的字符之一：][()\.^$?*+

raw_string='test[string]\.wibble'
quoted_string=$(printf %s "$raw_string" | sed 's/[][()\.^$?*+]/\\&/g')

$raw_string这将删除;中的尾随换行符。如果这是一个问题，请通过在末尾添加一个惰性字符来确保字符串不以换行符结尾，然后删除该字符。

quoted_string=$(printf %sa "$raw_string" | sed 's/[][()\.^$?*+]/\\&/g')
quoted_string=${quoted_string%?}

如何引用特殊字符（在 bash 或 zsh 中）

Bash 和 zsh 具有模式替换功能，如果字符串不是很长，则速度会更快。这里比较麻烦，因为替换必须是字符串，所以每个字符都需要单独替换。请注意，您必须先转义反斜杠。

quoted_string=${raw_string//\\//\\\\}
for c in \[ \] \( \) \. \^ \$ \? \* \+; do
  quoted_string=${quoted_string//"$c"/"\\$c"}
done

如何引用特殊字符（在 ksh93 中）

Ksh 的字符串替换结构比 bash 和 zsh 中的淡化版本更强大。它支持对模式中的组的引用。

quoted_string=${raw_string//@([][()\.^$?*+])/\\\1}

你真正想要什么

这里不需要find：shell 模式足以匹配以三位数字结尾的文件。如果不存在零件文件，则 glob 模式不会展开。还有一种更简单的方法来添加文件大小：stat您可以调用wc -c（在常规文件上，在大多数系统上，wc将查看文件大小，而不会费心打开文件并读取字节）。

set -- "$DESTINATION/$FILE_BASENAME".[0-9][0-9][0-9]
case $1 in
  *\]) # The glob was left intact, so no part exists
    do_split …;;
  *) # The glob was expanded, so at least one part exists
    FILE_SIZE_EXISTING=$(wc -c "$@" | sed -n '$s/[^0-9]//gp')
    if [ "$FILE_SIZE_EXISTING" -ne "$(wc -c <"$DESTINATION/$FILE_BASENAME")" ]; then
      do_split …
    fi

请注意，您对总大小的测试不太可靠：如果文件已更改但大小保持不变，您最终会得到陈旧的部分。如果文件永远不会改变，那也没关系，唯一的风险是部分内容可能被截断或丢失。

Answer 1

如何引用特殊字符（可移植）

以下代码片段在扩展正则表达式中的每个特殊字符之前添加一个反斜杠，用于用后跟该字符的反斜杠sed替换任何出现的字符之一：][()\.^$?*+

raw_string='test[string]\.wibble'
quoted_string=$(printf %s "$raw_string" | sed 's/[][()\.^$?*+]/\\&/g')

$raw_string这将删除;中的尾随换行符。如果这是一个问题，请通过在末尾添加一个惰性字符来确保字符串不以换行符结尾，然后删除该字符。

quoted_string=$(printf %sa "$raw_string" | sed 's/[][()\.^$?*+]/\\&/g')
quoted_string=${quoted_string%?}

如何引用特殊字符（在 bash 或 zsh 中）

Bash 和 zsh 具有模式替换功能，如果字符串不是很长，则速度会更快。这里比较麻烦，因为替换必须是字符串，所以每个字符都需要单独替换。请注意，您必须先转义反斜杠。

quoted_string=${raw_string//\\//\\\\}
for c in \[ \] \( \) \. \^ \$ \? \* \+; do
  quoted_string=${quoted_string//"$c"/"\\$c"}
done

如何引用特殊字符（在 ksh93 中）

Ksh 的字符串替换结构比 bash 和 zsh 中的淡化版本更强大。它支持对模式中的组的引用。

quoted_string=${raw_string//@([][()\.^$?*+])/\\\1}

你真正想要什么

这里不需要find：shell 模式足以匹配以三位数字结尾的文件。如果不存在零件文件，则 glob 模式不会展开。还有一种更简单的方法来添加文件大小：stat您可以调用wc -c（在常规文件上，在大多数系统上，wc将查看文件大小，而不会费心打开文件并读取字节）。

set -- "$DESTINATION/$FILE_BASENAME".[0-9][0-9][0-9]
case $1 in
  *\]) # The glob was left intact, so no part exists
    do_split …;;
  *) # The glob was expanded, so at least one part exists
    FILE_SIZE_EXISTING=$(wc -c "$@" | sed -n '$s/[^0-9]//gp')
    if [ "$FILE_SIZE_EXISTING" -ne "$(wc -c <"$DESTINATION/$FILE_BASENAME")" ]; then
      do_split …
    fi

请注意，您对总大小的测试不太可靠：如果文件已更改但大小保持不变，您最终会得到陈旧的部分。如果文件永远不会改变，那也没关系，唯一的风险是部分内容可能被截断或丢失。

grep 中基本/扩展 posix 正则表达式字符串中元字符的转义

答案1

如何引用特殊字符（可移植）

如何引用特殊字符（在 bash 或 zsh 中）

如何引用特殊字符（在 ksh93 中）

你真正想要什么

相关内容