从 HTML 中提取值的简单方法

Question 1

您可以通过以下方式提取示例中的值grep并将其分配给变量

$ x=$(wget -0 - 'http://foo/bar.html' | grep -Po '<value.*strValue="\K[[:digit:]]*')
$ echo $x
57

解释：

然而，对于一般方法来说，最好使用专用的 html 代码解析器。

Answer

您可以通过以下方式提取示例中的值grep并将其分配给变量

$ x=$(wget -0 - 'http://foo/bar.html' | grep -Po '<value.*strValue="\K[[:digit:]]*')
$ echo $x
57

解释：

然而，对于一般方法来说，最好使用专用的 html 代码解析器。

Question 2

我不知道wget你在说什么，但我猜你想下载该文件。如果是这样，是的，您可以下载它并解析它，无需中间临时文件：

$ value=$(wget -O - http://example.com/file.html | grep -oP 'strValue="\K[^"]+')
$ echo $value
57

Answer

我不知道wget你在说什么，但我猜你想下载该文件。如果是这样，是的，您可以下载它并解析它，无需中间临时文件：

$ value=$(wget -O - http://example.com/file.html | grep -oP 'strValue="\K[^"]+')
$ echo $value
57

Question 3

a) 提取标签的“文本”值<value>：

pup 'value text{}'  # yields 572

b) 提取标签的 strValue 属性的值<value>：

pup 'value attr{strvalue}' # yields 57

Answer

a) 提取标签的“文本”值<value>：

pup 'value text{}'  # yields 572

b) 提取标签的 strValue 属性的值<value>：

pup 'value attr{strvalue}' # yields 57

Question 4

cat input | grep -o strValue=".*" | sed 's/strValue=//g' | sed 's/"//g'

Answer

cat input | grep -o strValue=".*" | sed 's/strValue=//g' | sed 's/"//g'

相关内容