字符集反向搜索

字符集反向搜索

我有一组字符串(好吧,文件名,但我可以自己处理这个细节),我想将其转换为 UTF-8。但是,通过尝试显而易见的候选者,我无法成功完成转换,除非它必须是 8 位字符集。所以我想问,是否有某种“反向字符集搜索”实用程序?即,我可以提供输入,即十进制为 138 的字符应映射到 unicode 符号“ä”(U+00E4),然后该工具会吐出一个字符集列表。

答案1

我回答我自己,用类似这样的话来强行回答

for c in $(convmv --list); do echo -n "$c: "; convmv -f $c -t utf8 SOMEFILENAME_WITH_NON_UTF8_CHARS 2>/dev/null; done

在这种情况下,编码结果是“MacRoman”,这显然是 Apple 使用的一些 OSX 之前的编码。

相关内容