从本地 html 文件中解析出特定的 URL

Question

你说你需要“在 Bash 中”执行此操作，但你的意思似乎是“在脚本中”而不是“使用纯 Bash 语法”（有区别）。我猜你想要的是“在脚本中”的意思。

如果你已将所有链接保存在文档中的单独行上，则可以http://www.example.com/用以下方法找出域上的所有链接：

grep "^http://www\.example\.com/" filewithlinks.txt

或所有以结尾的.ogg链接

grep "\.ogg$" filewithlinks.txt

（句点前的反斜杠是为了转义“ .”符号，该符号原本表示“任何字符”。而“ \.”则表示文字句点。如果不进行转义，您还将匹配以“logg”结尾的链接。）

您也可以直接在awk 命令中进行行匹配，但我认为这会更复杂，因为需要时不时地进行更改。最简单的方法是像您所做的那样将完整的链接列表保存在一个文件中，然后只需使用grep上述示例搜索文件即可。这样，如果您想更改匹配模式，您也不必再次下载和解析文档。

Answer 1

你说你需要“在 Bash 中”执行此操作，但你的意思似乎是“在脚本中”而不是“使用纯 Bash 语法”（有区别）。我猜你想要的是“在脚本中”的意思。

如果你已将所有链接保存在文档中的单独行上，则可以http://www.example.com/用以下方法找出域上的所有链接：

grep "^http://www\.example\.com/" filewithlinks.txt

或所有以结尾的.ogg链接

grep "\.ogg$" filewithlinks.txt

（句点前的反斜杠是为了转义“ .”符号，该符号原本表示“任何字符”。而“ \.”则表示文字句点。如果不进行转义，您还将匹配以“logg”结尾的链接。）

您也可以直接在awk 命令中进行行匹配，但我认为这会更复杂，因为需要时不时地进行更改。最简单的方法是像您所做的那样将完整的链接列表保存在一个文件中，然后只需使用grep上述示例搜索文件即可。这样，如果您想更改匹配模式，您也不必再次下载和解析文档。

相关内容