我有一个文本文件,其中每一行如下所示:
<img border=0 width=555 height=555 src=http://websitelinkimagelinkhere>
每一行都是这样的,大约有 1500 行,我想对每一行进行“grep”(我不认为这会起作用,因为它会返回整行)http://websiteimagelinkhere'
输出文件应该在每个图像链接后都有换行符或制表符,就像原始文件一样。
或者如果有人只知道将每个元素放在同一列的单元格中的方法,那么这也是可以的。
答案1
如果每行一个:
sed 's/.*src=\([^>]*\)/\1/' inputfile
应该得到它。
URL 周围是否有引号?如果有:
sed 's/.*src="\([^"]*\)/\1/' inputfile
如果你有 GNU grep
:
grep -Po '.*?src="\K.*?(?=">)' inputfile
如果 URL 周围没有引号,则省略引号。grep
即使一行中有多个 URL,该版本仍可运行。
答案2
如果您想使用 Excel 将每个元素放入其自己的单元格,请使用数据 > 文本到列...。
然后使用 -space- 作为分隔符。在您的示例中,每行最终会有五列。