Shell 脚本用于从文件中提取数据并以 csv 格式存储到另一个文件中

Question 1

以下是我要解决的问题：

sed '/noScreen/ !d ; s/.*\(CLAS[0-9]\{4\}:\).*\(class=.*\).*/\1\2/ ; s/class=.//; s/.\/.*//'

Answer

以下是我要解决的问题：

sed '/noScreen/ !d ; s/.*\(CLAS[0-9]\{4\}:\).*\(class=.*\).*/\1\2/ ; s/class=.//; s/.\/.*//'

Question 2

给你，伙计：
filenames="1.html 2.html 3.html"; for filename in $filenames; do grep 'pageContentBars0' $filename | sed 's/.*$CLAS[^<\(]\+$.*/\1/' | sed 's/\:/,/'>>final.csv ; done

我假设它们都遵循相同的格式，因此最初使用类 pageContentBars0 进行过滤：
grep 'pageContentBars0' $filename

在这里，我正在寻找以 CLAS 开头的任何内容，捕获任何内容直到(或<。
.*$CLAS[^<\(]\+$

忽略其余部分，只需用捕获的内容替换整行即可重要信息：
.*/\1
最后，替换:为,：
sed 's/\:/,/'

Answer