使用 FindStr 从 HTML 文件获取 URL

Question

作为这个 StackOverflow 答案声明，你真的不应该尝试用正则表达式来解析 [X]HTML。查找字符串无论如何，正则表达式支持非常有限。

使用适当的 HTML 抓取工具/解析器，例如西代尔相反。以下命令将执行您要执行的操作：

xidel <URL or HTML file name> -q -e "//a/extract(@href/resolve-uri(.), 'https:\/\/s-media-cache-ak0\.pinimg\.com\/originals\/.*?\.jpg')[. != '']"

Answer 1

作为这个 StackOverflow 答案声明，你真的不应该尝试用正则表达式来解析 [X]HTML。查找字符串无论如何，正则表达式支持非常有限。

使用适当的 HTML 抓取工具/解析器，例如西代尔相反。以下命令将执行您要执行的操作：

xidel <URL or HTML file name> -q -e "//a/extract(@href/resolve-uri(.), 'https:\/\/s-media-cache-ak0\.pinimg\.com\/originals\/.*?\.jpg')[. != '']"

相关内容