需要删除文本中的奇怪符号

需要删除文本中的奇怪符号

我需要处理以下文本以摆脱奇怪的符号,例如:

â<80><99> â<80><9c> â<80>?

示例文本:

由于谜团无法解释,凯悦酒店试图通过在大厅安排一名警卫来给客人提供安全感。但沃尔夫无法摆脱小偷随时可能再次进入她房间的想法。“我好几个晚上都梦到这件事,”66 岁的沃尔夫说,他是一名戴尔 IT 服务顾问,正在休斯顿出差。

有人能帮我吗?我希望用 Vi 中的某些命令手动删除它,或者用脚本删除它。

答案1

我在这里找到了有问题的文字:http://www.forbes.com/sites/andygreenberg/2012/11/26/security-flaw-in-common-keycard-locks-exploited-in-string-of-hotel-room-break-ins/

导致问题的字符是花哨的引号和撇号,它们不是引号和撇号的标准 ascii 符号。

我将该文本粘贴到我的 vim 副本中,它可以很好地处理这些字符。

但当这种情况发生时,可以按照以下方法进行替换:http://aditya.sublucid.com/2008/01/18/replacing-those-pesky-smart-quotes-in-vim/

答案2

如果您从 Windows 或 DOS 计算机传输文件,则通常会发生此问题。要删除这些不需要的特殊字符,请使用“dos2unix”实用程序

mkannan@talksense-dr:~/tmp$ dos2unix test.sh 
dos2unix: converting file test.sh to UNIX format ...

相关内容