问题：Unicode 数据被 ascii 程序破坏

Question

您可以尝试使用iconv将输入转换为正确的编码。遗憾的是，我无法为您提供更精确的帮助，仅提供最终用法的示例：

html2text myfile.html  |  iconv -f iso-8859-1 -t utf-8 -c > good_output.txt

当然你必须替换你自己的字符集。

更新：

对于您来说，可行的解决方案是添加-utf8参数html2text：

 echo आचार्यपूज्यपादानामिष्टं | html2text -utf8

Answer 1

您可以尝试使用iconv将输入转换为正确的编码。遗憾的是，我无法为您提供更精确的帮助，仅提供最终用法的示例：

html2text myfile.html  |  iconv -f iso-8859-1 -t utf-8 -c > good_output.txt

当然你必须替换你自己的字符集。

更新：

对于您来说，可行的解决方案是添加-utf8参数html2text：

 echo आचार्यपूज्यपादानामिष्टं | html2text -utf8

相关内容