从 Excel 2016 保存的俄语 UTF-8 制表符分隔 csv 文件在文本编辑器中显示为垃圾

从 Excel 2016 保存的俄语 UTF-8 制表符分隔 csv 文件在文本编辑器中显示为垃圾

Excel 2016 中有一个选项可以导出为 UTF-8 逗号分隔的 CSV 文件。我不想在字段之间使用逗号 - 我想要制表符。

我将文件保存为制表符分隔的 txt 文件。在另存为对话框中,我依次转到“工具”和“Web 选项”,然后选择“编码”,并选择 UTF-8。然后,我使用 Sublime Text 3 打开它 - 我使用该 IDE 编写 python 脚本来操作文件(它太大,无法在记事本中打开)。

这是一个很大的文件,包含大约 200,000 个俄语句子以及翻译。其他文本看起来不错,但俄语字符都显示为 ???? ????。完全没用。

逗号分隔的 CSV 运行正常。难道就没有办法在 Excel 中成功保存制表符分隔的 UTF-8 CSV 文件吗?

答案1

我以前从未听说过这个“Web 选项”功能,不幸的是,在撰写本文时,正如 Deersfeet 所证实的,此功能在 Office 2016 中似乎已损坏。我也一直在测试它,并且可以重现此问题。

作为一种解决方法,您可以使用我一直使用的方法,因为我通常希望对我的导出设置有更多的控制权......

  • 打开 MS Access,从 Excel 导入数据
  • 在 Access 中导出数据。Access 有更多高级设置可用于导出到纯文本文件(封装、分隔符、行尾……)

针对您的具体问题的答案

Is there just no way to successfully save a tab-delimited UTF-8 CSV file in Excel?

似乎是:不。直到 MS 修复此问题。
您可以打开错误报告,但我已经厌倦了这样做,因为 MS 似乎并不关心社区反馈...

答案2

我相信最接近你所寻找的是“保存类型:Unicode 文本“。它提供用制表符分隔的文本文件并支持俄语字符,尽管它不是 utf-8 而是 unicode。

相关内容