如何删除文件中的特殊字符?

如何删除文件中的特殊字符?

我必须使用 OCR 来获取我不想手动输入的非常大的脚本的文本。

我有多行这样的

echo "<91>ps <97>eF|grep...

它应该读作;

echo "`ps -eF|grep...

即使使用“:set list”,我唯一看到的是 <91> 和 <97>

我尝试使用此字符和其他 ASCII 字符来插入反引号:

sed -e 's/'$(echo "97")'/`/g'

无济于事。

要么我做错了,要么使用了错误的控制值。

你能建议别的吗?

答案1

看起来像 cp1252(或类似的)。看哪些字符不直接从 Cp1252 映射到 UTF-8?。使用重新编码修复它...

相关内容