希腊语 Libreoffice 的问题

希腊语 Libreoffice 的问题

我遇到了一个问题,当我在 Libre Office 中打开一个 .csv 文件时,我已经处理了一个月,但不知为何,今天希腊字母无法正确显示,而是显示为问号。我能做些什么来解决这个问题?

答案1

我能做些什么来解决这个问题?

您的.csv文本使用错误的字符集读取。它可能被读取为“Unicode (UTF-8)”,但已使用其他字符集进行编码。

“文本导入”对话框允许选择不同的字符集来导入文件。字符集有很多,因此几乎不可能通过反复试验找到正确的字符集。但是,有一些工具可以猜测用于编码文件的字符集:

命令file

$ file -i export.csv 
export.csv: text/csv; charset=us-ascii

在这个例子中,文件不包含任何扩展字符:它是纯 us-asci。

命令encguessperl包)

$ encguess data.csv
data.csv    UTF-8

表明该文件是UTF-8编码的。

然后,您可以在 Calc 中的“文本导入”对话框中选择报告的字符集。如果结果正确,您可以选择将其保存为“Unicode (UTF-8)”,这是 Ubuntu(和 LibreOffice Calc)中的默认系统字符编码。

背景

.csv文件是普通的文本文件。在计算机中,字符被映射到字节序列。许多字符使用单个字节,但更多的字符使用字节组合。映射在字符集中定义。不幸的是,存在许多字符集。只有一个字符集用于将希腊字符编码到文本文件中。需要相同的字符集将文本文件中的字节转换回相同的希腊字符。

文本文件仅有的包含组成字符的字节。因此,此类文件不包含任何有关使用哪种字符集对文件进行编码的线索。在 Linux 中,默认情况下使用 Unicode (UTF-8)。应用程序在打开以不同集合编码的文件时可能会自动猜测正确的字符代码。如果它们没有猜出正确的字符集,文件中的许多字符可能会以不同的方式呈现,如果编码与所用字符集中的任何字符都不匹配,则会出现问号。

相关内容