从 HTML 页面中提取文本

从 HTML 页面中提取文本

我正在使用 xidel 命令从 HTML 页面中提取文本。这是我的代码

  xidel  http://www.ip-adress.com/ip_tracer/8.8.8.8 --extract "<table>
  <tbody>
 <tr>
 <td>
 <table>
 <tbody>
  <tr> </tr>
 <template:loop>
  <tr> <th> {$field1} </th> <td> ${field2} </td> </tr>
  </template:loop>
  </tbody>
   </table>
   </td>
   <td> </td>
    </tr>
    </tbody>
     </table>
       " 

我用的是模板方法。当我运行这段代码时。我在终端上没有收到错误或任何输出。这是执行此代码后得到的结果

    **** Retrieving (GET): http://www.ip-adress.com/ip_tracer/8.8.8.8 ****
    **** Processing: http://www.ip-adress.com/ip_tracer/8.8.8.8 ****
     ** Current variable state: **

并返回 $ 提示符。我想知道输出是否存储在任何变量中?

答案1

例子给出的 forxidel表明它写入标准输出。如果您想捕获该信息,则必须将标准输出重定向到文件或您自己的 shell 变量。

例如,示例 10 这样做是为了在 bash 中设置变量:

eval "$(xidel http://site -e 'title:=//title' -e 'links:=//a/@href' --output-format bash)"

示例底部有一条注释指向自述文件对于xidel(显然是这样的文档)。

相关内容