我有一个文件列表,其名称似乎是用 VISCII 或某种东亚格式编写的(我知道该语言是越南语)。我想使用 将iconv
文件名转换为 UTF-8,但不知道当前的字符集是什么。我尝试了几个选项,但出现了错误iconv
。
以下是文件列表中的一些示例:
1 2 3 CHIA ðÈI LÈýI V-¦_(831641).mid CON ð¦i¦NG CHUýNG TA ðI_(829013).mid HAÌY SÈýNG CU¦NG TI¦NH Y-U_(830818) M-Y TI¦NH Y-U_(830639).mid NG¦i¦I CHI-ýN SIÌ -ýY_(830491).mid SAO CH¦A TH-ýY HȦI -M (A)_(829702).mid TR-N MAÊNH ð-ýT TI¦NH NG¦i¦I_(829041).mid
转换结果应该是这样的:
1 2 3 chia ðÈI LÈýI V-¦.mid
到
1 2 3 chia đôi lối về.mid
查找编码的最佳方法是什么?我尝试过从VISCII
、到cp936
,但都不起作用。cp1258
UTF-8
仅供参考:我安装了越南语语言包,它似乎对某些程序有效,但对 Windows 10 中的文件资源管理器无效。我在想也许可以将默认字体更改为允许字符集的字体,但我必须破解 Windows 10 中的注册表。
答案1
我必须在 Windows 10 的语言和区域设置中下载越南语包。
我被搞晕了,因为所有文件都是压缩的。我在安装语言包之前就解压了它们,所以所有文件名都从 UTF-16(或东亚编码之一)永久转换为 UTF-8(我认为不包括越南字符集)。
然后我安装了越南语语言包,因此当打开文件时,内容可以使用正确的字符集正确读取,但文件名保持不变。
我所要做的就是删除第一个解压缩批次并再次解压缩并使用正确的字符集。
不完全确定幕后发生了什么,所以无法提供技术解释,但希望我的高级解释能够对未来的某人有所帮助。