匹配后有 sed echo 字符串

Question 1

您的输出包含任意数量的随机内容以及您感兴趣的一行。选择该行，丢弃除 ID 之外的任何内容并打印结果：

 sed -n '/profile_images/s/.*profile_images\\\/\([0-9]\+\).*/\1/p'

通过在处理完该行后立即退出，可以稍微提高效率。

事实上，这几乎正是原始代码的作用。唯一改变的是使用的正则表达式。

Answer

您的输出包含任意数量的随机内容以及您感兴趣的一行。选择该行，丢弃除 ID 之外的任何内容并打印结果：

 sed -n '/profile_images/s/.*profile_images\\\/\([0-9]\+\).*/\1/p'

通过在处理完该行后立即退出，可以稍微提高效率。

事实上，这几乎正是原始代码的作用。唯一改变的是使用的正则表达式。

Question 2

当我遇到像大海捞针这样的工作时，如果可以的话，我喜欢把它变成面向线条的问题。你也许可以用这样的东西来做到这一点：

$ sed -E 's:[0-9]+:\n&\n:g' filename \
| grep -F -A1 '/pbs.twimg.com\/profile_images\' | tail -1

这会将任何数字字符串单独占一行，greps 查找您的字符串，然后打印后面的一个。

这真是一个黑客；解析 HTML 的正确方法是使用 HTML 解析器。但它可能可以完成您只需要一根字符串的受控输入的工作。

稍微简洁的方法是使用 awk，如果您经常处理此类事情，那么绝对值得学习。

Answer

当我遇到像大海捞针这样的工作时，如果可以的话，我喜欢把它变成面向线条的问题。你也许可以用这样的东西来做到这一点：

$ sed -E 's:[0-9]+:\n&\n:g' filename \
| grep -F -A1 '/pbs.twimg.com\/profile_images\' | tail -1

这会将任何数字字符串单独占一行，greps 查找您的字符串，然后打印后面的一个。

这真是一个黑客；解析 HTML 的正确方法是使用 HTML 解析器。但它可能可以完成您只需要一根字符串的受控输入的工作。

稍微简洁的方法是使用 awk，如果您经常处理此类事情，那么绝对值得学习。

相关内容