在 bash 脚本中根据模式提取多个字符串

Question

您的示例数据看起来像是 json 的损坏片段，因此您确实应该使用jq它来从中提取您需要的内容前做任何你对原始输入所做的事情，导致它看起来像这样。

但是，要从您拥有的内容中提取以https://www双引号字符开头且不包含双引号字符的 URL，您可以使用grep：

$ grep -o 'https://www[^"]*' input.txt 
https://www.mycompany.com/posts/aureliaflore_china-seoul-startup-activity-6571925510337728512-acAw
https://www.mycompany.com/posts/aureliaflore_reuters-top-news-on-twitter-activity-6571392661482233856-T3dO
https://www.mycompany.com/posts/aureliaflore_are-you-thinking-to-the-benefits-of-digitalization-activity-6570119712154451968-927T

Answer 1

您的示例数据看起来像是 json 的损坏片段，因此您确实应该使用jq它来从中提取您需要的内容前做任何你对原始输入所做的事情，导致它看起来像这样。

但是，要从您拥有的内容中提取以https://www双引号字符开头且不包含双引号字符的 URL，您可以使用grep：

$ grep -o 'https://www[^"]*' input.txt 
https://www.mycompany.com/posts/aureliaflore_china-seoul-startup-activity-6571925510337728512-acAw
https://www.mycompany.com/posts/aureliaflore_reuters-top-news-on-twitter-activity-6571392661482233856-T3dO
https://www.mycompany.com/posts/aureliaflore_are-you-thinking-to-the-benefits-of-digitalization-activity-6570119712154451968-927T

在 bash 脚本中根据模式提取多个字符串

答案1

相关内容