awk 在 html 表数据之间选择列

Question

这就是你想要的：

$ awk -F'</*td>' '$2{print $2}' someFile

这是通过定义一个匹配开始<td>和结束的分割参数来实现的</td>。这将中间的字符串隔离为 field $2。$2如果已定义，则剩余部分将被打印。

例子

$ cat someFile
!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML>
   <HEAD>
      <TITLE>
         A Small Hello
      </TITLE>
   </HEAD>
<BODY>
   <table><td>hello world</td></table>
   <table><td>hello world</td></table>
   <table><td>hello world</td></table>
   <table>
   <td>hello world</td>
   </table>
   <H1>Hi</H1>
   <P>This is very minimal "hello world" HTML document.</P>
</BODY>
</HTML>

输出：

$ awk -F'</*td>' '$2{print $2}' someFile
hello world
hello world
hello world
hello world

参考

删除 awk 显示中的空白行

Answer 1

这就是你想要的：

$ awk -F'</*td>' '$2{print $2}' someFile

这是通过定义一个匹配开始<td>和结束的分割参数来实现的</td>。这将中间的字符串隔离为 field $2。$2如果已定义，则剩余部分将被打印。

例子

$ cat someFile
!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML>
   <HEAD>
      <TITLE>
         A Small Hello
      </TITLE>
   </HEAD>
<BODY>
   <table><td>hello world</td></table>
   <table><td>hello world</td></table>
   <table><td>hello world</td></table>
   <table>
   <td>hello world</td>
   </table>
   <H1>Hi</H1>
   <P>This is very minimal "hello world" HTML document.</P>
</BODY>
</HTML>

输出：

$ awk -F'</*td>' '$2{print $2}' someFile
hello world
hello world
hello world
hello world

参考

删除 awk 显示中的空白行

awk 在 html 表数据之间选择列

答案1

例子

参考

相关内容