仅查找文件中的 GUID - Bash

Question 1

与 GNU 实现grep（或兼容）：

<your-file grep -Ewo '[[:xdigit:]]{8}(-[[:xdigit:]]{4}){3}-[[:xdigit:]]{12}' |
  while IFS= read -r guid; do
    your-action "$guid"
    sleep 5
  done

会在输入中的任何位置找到这些 GUID（前提是它们之前或之后都没有单词字符）。

GNUgrep有一个-o选项可以打印正则表达式的非空匹配。

-w是另一个非标准扩展，我相信来自 SysV，仅匹配整个单词。仅当匹配文本介于非单词和单词字符之间的转换以及单词和非单词字符之间的转换（其中单词字符是字母数字或下划线）时，它才匹配。这是为了防止匹配以下内容：

啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

其余部分是标准 POSIX 语法。请注意，[[:xdigit:]]ABCDEF 也匹配。[0123456789abcdef]如果您只想匹配小写 GUID，则可以将其替换为。

Answer

与 GNU 实现grep（或兼容）：

<your-file grep -Ewo '[[:xdigit:]]{8}(-[[:xdigit:]]{4}){3}-[[:xdigit:]]{12}' |
  while IFS= read -r guid; do
    your-action "$guid"
    sleep 5
  done

会在输入中的任何位置找到这些 GUID（前提是它们之前或之后都没有单词字符）。

GNUgrep有一个-o选项可以打印正则表达式的非空匹配。

-w是另一个非标准扩展，我相信来自 SysV，仅匹配整个单词。仅当匹配文本介于非单词和单词字符之间的转换以及单词和非单词字符之间的转换（其中单词字符是字母数字或下划线）时，它才匹配。这是为了防止匹配以下内容：

啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

其余部分是标准 POSIX 语法。请注意，[[:xdigit:]]ABCDEF 也匹配。[0123456789abcdef]如果您只想匹配小写 GUID，则可以将其替换为。

Question 2

虽然我喜欢正则表达式，但我更喜欢避免过度指定。对于这个特定的数据集（已知的数据格式，每行一个 GUID，加上页眉和页脚），我只需删除页眉/页脚：

$ cat guids.txt | egrep -v 'GUIDs|--|rows|^$' |
    while read guid ; do
      some_command "$guid"
      sleep 5
    done

或者，我会 grep 出我想要的行，但也使当前数据集的正则表达式尽可能简单：

egrep '^[0-9a-f-]{36}$'

Answer

虽然我喜欢正则表达式，但我更喜欢避免过度指定。对于这个特定的数据集（已知的数据格式，每行一个 GUID，加上页眉和页脚），我只需删除页眉/页脚：

$ cat guids.txt | egrep -v 'GUIDs|--|rows|^$' |
    while read guid ; do
      some_command "$guid"
      sleep 5
    done

或者，我会 grep 出我想要的行，但也使当前数据集的正则表达式尽可能简单：

egrep '^[0-9a-f-]{36}$'

仅查找文件中的 GUID - Bash

答案1

答案2

相关内容