我需要处理以下文本以摆脱奇怪的符号,例如:
â<80><99> â<80><9c> â<80>?
示例文本:
由于谜团无法解释,凯悦酒店试图通过在大厅安排一名警卫来给客人提供安全感。但沃尔夫无法摆脱小偷随时可能再次进入她房间的想法。“我好几个晚上都梦到这件事,”66 岁的沃尔夫说,他是一名戴尔 IT 服务顾问,正在休斯顿出差。
有人能帮我吗?我希望用 Vi 中的某些命令手动删除它,或者用脚本删除它。
答案1
导致问题的字符是花哨的引号和撇号,它们不是引号和撇号的标准 ascii 符号。
我将该文本粘贴到我的 vim 副本中,它可以很好地处理这些字符。
但当这种情况发生时,可以按照以下方法进行替换:http://aditya.sublucid.com/2008/01/18/replacing-those-pesky-smart-quotes-in-vim/
答案2
如果您从 Windows 或 DOS 计算机传输文件,则通常会发生此问题。要删除这些不需要的特殊字符,请使用“dos2unix”实用程序
mkannan@talksense-dr:~/tmp$ dos2unix test.sh
dos2unix: converting file test.sh to UNIX format ...