仅使用 bash 脚本从 CSV 字段中删除逗号

Question 1

您的“CSV”文件已损坏。您应该修复生成它的任何内容，以便它用双引号包含逗号字符的任何字段。然后使用perl（例如文本::CSV）或Python（例如数据集）或者磨坊主使用它们 - sed 和 awk 对于简单的逗号分隔文件来说还可以，但对于带有包含逗号、换行符或其他有问题字符的带引号字段的实际 CSV 文件来说则不然。

但是，您的 IP 地址似乎是用逗号和空格分隔的。如果情况总是如此（并且没有其他字段以空格开头），那么您可以使用 sed 命令来定位它 - 例如：

sed -e 's/, / /g'

Answer

您的“CSV”文件已损坏。您应该修复生成它的任何内容，以便它用双引号包含逗号字符的任何字段。然后使用perl（例如文本::CSV）或Python（例如数据集）或者磨坊主使用它们 - sed 和 awk 对于简单的逗号分隔文件来说还可以，但对于带有包含逗号、换行符或其他有问题字符的带引号字段的实际 CSV 文件来说则不然。

但是，您的 IP 地址似乎是用逗号和空格分隔的。如果情况总是如此（并且没有其他字段以空格开头），那么您可以使用 sed 命令来定位它 - 例如：

sed -e 's/, / /g'

Question 2

只需在你的模式之前添加1 !这样的

sed '1 ! s/\(\([^,]*,\)\{9\}[^,]*\),/\1/g'

这会跳过标题

输出

$ sed '1 ! s/\(\([^,]*,\)\{9\}[^,]*\),/\1/g' d
Name,Age,Gender,id,Phone,Address,City,State,Country,IPAddress,OtherColumn1,OtherColumn2
John,25,Male,12,123,Main St,New York,NY,USA,120.30.19 119.234.761,Value1,Value2

Answer

只需在你的模式之前添加1 !这样的

sed '1 ! s/\(\([^,]*,\)\{9\}[^,]*\),/\1/g'

这会跳过标题

输出

$ sed '1 ! s/\(\([^,]*,\)\{9\}[^,]*\),/\1/g' d
Name,Age,Gender,id,Phone,Address,City,State,Country,IPAddress,OtherColumn1,OtherColumn2
John,25,Male,12,123,Main St,New York,NY,USA,120.30.19 119.234.761,Value1,Value2

Question 3

使用任何 awk：

$ awk 'BEGIN{FS=OFS=","} NF>12{$10=$10 $11; $11=$12; $12=$13; sub(/,[^,]*$/,"")} 1' file
Name,Age,Gender,id,Phone,Address,City,State,Country,IPAddress,OtherColumn1,OtherColumn2
John,25,Male,12,123,Main St,New York,NY,USA,120.30.19 119.234.761,Value1,Value2

或者如果您愿意：

$ awk 'BEGIN{FS=OFS=","} {print $1, $2, $3, $4, $5, $6, $7, $8, $9, $10 (NF>12 ? $11 : ""), $(NF-1), $NF}' file
Name,Age,Gender,id,Phone,Address,City,State,Country,IPAddress,OtherColumn1,OtherColumn2
John,25,Male,12,123,Main St,New York,NY,USA,120.30.19 119.234.761,Value1,Value2

Answer

使用任何 awk：

$ awk 'BEGIN{FS=OFS=","} NF>12{$10=$10 $11; $11=$12; $12=$13; sub(/,[^,]*$/,"")} 1' file
Name,Age,Gender,id,Phone,Address,City,State,Country,IPAddress,OtherColumn1,OtherColumn2
John,25,Male,12,123,Main St,New York,NY,USA,120.30.19 119.234.761,Value1,Value2

或者如果您愿意：

$ awk 'BEGIN{FS=OFS=","} {print $1, $2, $3, $4, $5, $6, $7, $8, $9, $10 (NF>12 ? $11 : ""), $(NF-1), $NF}' file
Name,Age,Gender,id,Phone,Address,City,State,Country,IPAddress,OtherColumn1,OtherColumn2
John,25,Male,12,123,Main St,New York,NY,USA,120.30.19 119.234.761,Value1,Value2

仅使用 bash 脚本从 CSV 字段中删除逗号

答案1

答案2

答案3

相关内容