每次我下载带有特殊字符(例如 ă、ș 和 ț(罗马尼亚特殊字符))的字幕时,我的系统都会转换 ã、º 和 þ 中的字符。如果我尝试在 gedit 中替换这些字符,则会收到此错误:
Could not save the file using the “Western (ISO-8859-15)” character encoding.
The document contains one or more characters that cannot be encoded using the specified character encoding.
Select a different character encoding from the menu and try again.
Character Encoding Current Locate UTF-8
我不想转换我要下载的每个文件,我希望默认情况下正确读取我的文本文件。几年前我解决了这个问题,但在全新安装后,我记不起我做了什么。我有 Ubuntu 18.04.1
答案1
我对此没有通用的解决方案,但对于字幕,我始终安装轻量级文本编辑器leafpad
。leafpad
能够非常好地识别文本文件的代码页,并且通常可以正确打开它。Ctrl+s然后允许“另存为”:在对话框中,保留文件名,但将编码更改为 UTF-8。
有一个终端命令iconv
也允许更改字符代码。但是,在进行转换之前,您需要自己知道当前的字符代码。您可以使用命令获取该代码file -b --mime-encoding <yourfile>
。