使用 cut 返回字符串的中间部分

Question 1

您可以使用cut的-d选项来定义分隔符（从结果字段中排除）：

echo "<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>" | cut -d\> -f2 | cut -d\< -f1

这会分割>并输出第二个字段，留下{41c33a-4893b-3627a-617a}</xml:attribute，然后再次分割<并输出第一个字段。

字段描述分隔符之间、文本开头和第一个分隔符之间以及最后一个分隔符和文本结尾之间的文本。使用>原始文本，您最终会得到：

<xml:attribute
{41c33a-4893b-3627a-617a}</xml:attribute
空字符串

（省略分隔符）。然后<在字段 2 上使用给出

{41c33a-4893b-3627a-617a}
/xml:attribute

字段 1 是您要查找的结果。

Answer

您可以使用cut的-d选项来定义分隔符（从结果字段中排除）：

echo "<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>" | cut -d\> -f2 | cut -d\< -f1

这会分割>并输出第二个字段，留下{41c33a-4893b-3627a-617a}</xml:attribute，然后再次分割<并输出第一个字段。

字段描述分隔符之间、文本开头和第一个分隔符之间以及最后一个分隔符和文本结尾之间的文本。使用>原始文本，您最终会得到：

<xml:attribute
{41c33a-4893b-3627a-617a}</xml:attribute
空字符串

（省略分隔符）。然后<在字段 2 上使用给出

{41c33a-4893b-3627a-617a}
/xml:attribute

字段 1 是您要查找的结果。

Question 2

对于简单的字符串操作，您通常应该使用 shell 自己的构造，绑定到参数扩展。外部实用程序更适合处理大量文本，但对于单个字符串，启动外部工具很慢并且正确引用可能很困难。

mystring='<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>'
content="${mystring#*>}"; content="${content%<*}"
braced="${mystring#*\{}"; braced="${braced%%\}*}"; braced="{$braced}"

content设置为原始字符串减去前导和尾随<…>部分。braced设置为看起来像的第一部分{…}。

Answer

对于简单的字符串操作，您通常应该使用 shell 自己的构造，绑定到参数扩展。外部实用程序更适合处理大量文本，但对于单个字符串，启动外部工具很慢并且正确引用可能很困难。

mystring='<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>'
content="${mystring#*>}"; content="${content%<*}"
braced="${mystring#*\{}"; braced="${braced%%\}*}"; braced="{$braced}"

content设置为原始字符串减去前导和尾随<…>部分。braced设置为看起来像的第一部分{…}。

Question 3

您还可以sed提取由正则表达式指定的字段。如果您有更复杂的匹配条件，则很有用：

echo '<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>' | \
sed -E 's/^.+>({.+})<.+$/\1/'

Answer

您还可以sed提取由正则表达式指定的字段。如果您有更复杂的匹配条件，则很有用：

echo '<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>' | \
sed -E 's/^.+>({.+})<.+$/\1/'

Question 4

或者使用awk，使用正则表达式<|>作为字段分隔符：

$ echo "<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>" | 
       awk -F '<|>' '{print $3}'
{41c33a-4893b-3627a-617a}

注意：使用 GNU awk、mawk和进行测试original-awk。在这三个中的工作原理相同。

该perl版本非常相似（除了perl数组是从零开始的，并且perl的print语句不会输出尾随，\n除非您明确告诉它）：

echo "<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>" |
     perl -n -a -F'<|>' -e 'print $F[2],"\n"'

另请注意 - 这只能可靠地工作，因为它是包含单个 XML 片段的单行输入。正则表达式不能用于可靠地解析实际的 XML。请使用 XML 解析工具来代替，例如，或用于、、和其他语言xmlstarlet的许多 XML 解析库之一。perlpython

Answer

或者使用awk，使用正则表达式<|>作为字段分隔符：

$ echo "<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>" | 
       awk -F '<|>' '{print $3}'
{41c33a-4893b-3627a-617a}

注意：使用 GNU awk、mawk和进行测试original-awk。在这三个中的工作原理相同。

该perl版本非常相似（除了perl数组是从零开始的，并且perl的print语句不会输出尾随，\n除非您明确告诉它）：

echo "<xml:attribute>{41c33a-4893b-3627a-617a}</xml:attribute>" |
     perl -n -a -F'<|>' -e 'print $F[2],"\n"'

另请注意 - 这只能可靠地工作，因为它是包含单个 XML 片段的单行输入。正则表达式不能用于可靠地解析实际的 XML。请使用 XML 解析工具来代替，例如，或用于、、和其他语言xmlstarlet的许多 XML 解析库之一。perlpython

使用 cut 返回字符串的中间部分

答案1

答案2

答案3

答案4

相关内容