CSV - 只保留某些条目

Question 1

cut -d\" -f2,4,10 <in | tr \" , >out

...只会抓取字段 1,2 和 5 的引用位，然后确保它们用逗号分隔。

或者，因为引号内可能出现一些逗号......

 cut -d\" -f-5,10-11 <in | sed s/,$// >out

...甚至...

cut -d\" -f-5,10 <in | paste -d\" - /dev/null >out

...可能会将其设置为正确的。

第一个打印：

stampthisandthat.com,GANDI SAS,A.DNS.GANDI.NET|B.DNS.GANDI.NET|C.DNS.GANDI.NET|
salochinbd.com,FASTDOMAIN, INC.,NS1.IPAGE.COM|NS2.IPAGE.COM|

……还有第二个、第三个……

"stampthisandthat.com","GANDI SAS","A.DNS.GANDI.NET|B.DNS.GANDI.NET|C.DNS.GANDI.NET|"
"salochinbd.com","FASTDOMAIN, INC.","NS1.IPAGE.COM|NS2.IPAGE.COM|"

以下示例演示了如何对字段 1,3,17,21,22,23,24 执行类似操作：

printf '"%s"\n' "$(seq -s\",\" 35)" |
cut -d\" -f-3,6-7,34-35,42-48       |
paste -d\" - /dev/null

"1","3","17","21","22","23","24"

...仅将那些字段拉出输出，seq如下所示：

"1","2","3",..."35"

Answer

cut -d\" -f2,4,10 <in | tr \" , >out

...只会抓取字段 1,2 和 5 的引用位，然后确保它们用逗号分隔。

或者，因为引号内可能出现一些逗号......

 cut -d\" -f-5,10-11 <in | sed s/,$// >out

...甚至...

cut -d\" -f-5,10 <in | paste -d\" - /dev/null >out

...可能会将其设置为正确的。

第一个打印：

stampthisandthat.com,GANDI SAS,A.DNS.GANDI.NET|B.DNS.GANDI.NET|C.DNS.GANDI.NET|
salochinbd.com,FASTDOMAIN, INC.,NS1.IPAGE.COM|NS2.IPAGE.COM|

……还有第二个、第三个……

"stampthisandthat.com","GANDI SAS","A.DNS.GANDI.NET|B.DNS.GANDI.NET|C.DNS.GANDI.NET|"
"salochinbd.com","FASTDOMAIN, INC.","NS1.IPAGE.COM|NS2.IPAGE.COM|"

以下示例演示了如何对字段 1,3,17,21,22,23,24 执行类似操作：

printf '"%s"\n' "$(seq -s\",\" 35)" |
cut -d\" -f-3,6-7,34-35,42-48       |
paste -d\" - /dev/null

"1","3","17","21","22","23","24"

...仅将那些字段拉出输出，seq如下所示：

"1","2","3",..."35"

Question 2

有一个鲜为人知的程序，名叫csv报价这使得可以使用cut、sed、和等标准工具awk来处理 CSV 文件。它的工作原理是将引号内的特殊字符映射到一些不可打印的字符，然后将它们映射回来。有了这个程序，就这么简单：

csvquote file.csv | cut -d , -f 1,2,5 | csvquote -u

输出：

"stampthisandthat.com","GANDI SAS","A.DNS.GANDI.NET|B.DNS.GANDI.NET|C.DNS.GANDI.NET|"
"salochinbd.com","FASTDOMAIN, INC.","NS1.IPAGE.COM|NS2.IPAGE.COM|"

Answer

有一个鲜为人知的程序，名叫csv报价这使得可以使用cut、sed、和等标准工具awk来处理 CSV 文件。它的工作原理是将引号内的特殊字符映射到一些不可打印的字符，然后将它们映射回来。有了这个程序，就这么简单：

csvquote file.csv | cut -d , -f 1,2,5 | csvquote -u

输出：

"stampthisandthat.com","GANDI SAS","A.DNS.GANDI.NET|B.DNS.GANDI.NET|C.DNS.GANDI.NET|"
"salochinbd.com","FASTDOMAIN, INC.","NS1.IPAGE.COM|NS2.IPAGE.COM|"

Question 3

awk -F',' '{print $1 $2 $5}'- 这就是你要找的吗？

Answer

awk -F',' '{print $1 $2 $5}'- 这就是你要找的吗？

Question 4

要解决字段中包含逗号的问题，请将字段分隔符更改为引号+逗号;假设您在字段中包含的逗号不在字段的开头和/或结尾。

$ awk -F'(\",)' '{print $1 $2 $17}' test.txt

只要确保你逃脱将引号和包围字段分隔符放在单引号中以保护您的 shell。

笔记gawk我相信这是在 Fedora 20 上使用的。

Answer

要解决字段中包含逗号的问题，请将字段分隔符更改为引号+逗号;假设您在字段中包含的逗号不在字段的开头和/或结尾。

$ awk -F'(\",)' '{print $1 $2 $17}' test.txt

只要确保你逃脱将引号和包围字段分隔符放在单引号中以保护您的 shell。

笔记gawk我相信这是在 Fedora 20 上使用的。

CSV - 只保留某些条目

答案1

答案2

答案3

答案4

相关内容