GNU sed (适用于 Windows) 可以处理 Unicode 吗？如果可以，是代码页/语言环境问题，还是开关问题？

Question

我对 sed 了解不多，但经过一番努力的 Google 搜索后，它似乎通过 LANG 环境变量支持各种代码页。我相信在没有 LANG 的情况下，UTF-8 实际上是默认的。但我不知道 Windows 端口是如何设置的。我确实强烈怀疑 sed 对输入流根本没有执行任何检测处理。

您还可以尝试如下所述的转义字符：http://forums.whirlpool.net.au/forum-replies-archive.cfm/841095.html 但这看起来很麻烦。

Answer 1

我对 sed 了解不多，但经过一番努力的 Google 搜索后，它似乎通过 LANG 环境变量支持各种代码页。我相信在没有 LANG 的情况下，UTF-8 实际上是默认的。但我不知道 Windows 端口是如何设置的。我确实强烈怀疑 sed 对输入流根本没有执行任何检测处理。

您还可以尝试如下所述的转义字符：http://forums.whirlpool.net.au/forum-replies-archive.cfm/841095.html 但这看起来很麻烦。

相关内容