有一个像这样的 CSV 文件:
HEADER
"first, column"|"second "some random quotes" column"|"third ol' column"
FOOTER
并寻找如下结果:
HEADER
first, column|second "some random quotes" column|third ol' column
换句话说,删除FOOTER
begin、end 和 around 中的 , 引号|
。
到目前为止,这段代码有效:
sed '/FOOTER/d' csv > csv1 | #remove FOOTER
sed 's/^\"//' csv1 > csv2 | #remove quote at the beginning
sed 's/\"$//' csv2 > csv3 | #remove quote at the end
sed 's/\"|\"/|/g' csv3 > csv4 #remove quotes around pipe
正如您所看到的,问题是它创建了 4 个额外的文件。
这是另一个解决方案,其目标是不创建额外的文件并在单个脚本中执行相同的操作。效果不太好。
#!/bin/ksh
sed '/begin/, /end/ {
/FOOTER/d
s/^\"//
s/\"$//
s/\"|\"/|/g
}' csv > csv4
答案1
首先,正如 Michael 所展示的,您可以将所有这些组合到一个命令中:
sed '/^FOOTER/d; s/^\"//; s/\"$//; s/\"|\"/|/g' csv > csv1
我认为某些sed
实现无法应对这一点,可能需要:
sed -e '/^FOOTER/d' -e 's/^\"//' -e 's/\"$//' -e 's/\"|\"/|/g' csv > csv1
也就是说,看起来您的字段是由 定义的|
,您只想删除"
整个字段,留下字段内的字段。在这种情况下,你可以这样做:
$ sed '/FOOTER/d; s/\(^\||\)"/\1/g; s/"\($\||\)/\1/g' csv
HEADER
first, column|second "some random quotes" column|third ol' column
或者,使用 GNU sed
:
sed -r '/FOOTER/d; s/(^|\|)"/\1/g; s/"($|\|)/\1/g' csv
您还可以使用 Perl:
$ perl -F"|" -lane 'next if /FOOTER/; s/^"|"$// for @F; print @F' csv
HEADER
first, column|second some random quotes column|third ol' column
答案2
这也可以工作:
sed's/^"//;s/"|"/|/g;s/""$/"/'
例子:
$ echo '"this"|" and "ths""|" and "|" this 2"|" also "this", "thi", "and th""' |
sed 's/^"//; s/"|"/|/g; s/""$/"/'
this| and "ths"| and | this 2| also "this", "thi", "and th"
漂亮的版本
sed '
s/^"//
s/"|"/|/g
s/""$/"/
$d
'
答案3
sed
对我有用的命令是:
sed 's/ALA/A/g;s/CYS/C/g;s/ASP/D/g;s/GLU/E/g;s/PHE/F/g;s/GLY/G/g;s/HIS/H/g;s/HID/H/g;s/HIE/H/g;s/ILE/I/g;s/LYS/K/g;s/LEU/L/g;s/MET/M/g;s/ASN/N/g;s/PRO/P/g;s/GLN/Q/g;s/ARG/R/g;s/SER/S/g;s/THR/T/g;s/VAL/V/g;s/TRP/W/g;s/TYR/Y/g;s/MSE/X/g;s/ //g' < old.txt > new.fasta
sed 命令无法通过管道传输。它必须作为单个命令给出。