我有一个 Google 文档电子表格,我想将其导出为 csv。问题是,某些单元格的内容包含在引号中:
1,1,"I don't want quote",Mee too but I'm lucky,1
为了避免这个问题,我通常会在 google 文档上重新编辑该字段,直到导出时排除引号(我不知道为什么或何时包含它们)。
我尝试过格式化,但似乎没有帮助。我该怎么办?
答案1
我有一个 google 文档电子表格,想将其导出为 csv
这可能不太合胃口,但你似乎想以一种非 CSV 格式下载它,但这种格式有点像 CSV,但与 CSV 不兼容。Google 可能不接受任意的用户定义格式。
我不知道为什么或何时加入了 [引号]
当单元格的数据值包含逗号等分隔符时。
我应该怎么办?
任何
使用 CSV 并在您使用的编程语言中使用适当的 CSV 解析或 CSV 读取库函数。
使用 CSV 并使用具有良好 CSV 处理库函数的另一种语言(首先想到的是 Perl,但还有很多)对文件进行预处理,然后以程序可以处理的格式写入数据
使用“文本”(实际上是 .TSV),它使用制表符而不是逗号作为分隔符,并且不引用包含逗号的字段。将您的程序更改为按制表符而不是逗号进行拆分。希望您的程序永远不会遇到包含制表符的数据值。
答案2
更新 - 似乎自这篇文章以来,Google Sheets 现在只能导出不带双引号的 CSV。太糟糕了。我真的可以使用引号。一些基本的导出选项会很好。
答案3
Linux终端的解决方案:
curl "https://docs.google.com/spreadsheets/d/${_SECRET_}/gviz/tq?tqx=out:csv&gid=${_gid_}" \
| csvformat > fileName.csv
使用工具(sudo pip install csvkit
)来规范化 CSV 文件。