从文本文件中删除 字符

从文本文件中删除  字符

我有一个巨大的文本文件,其中包含我想删除的字符串/字符 <200b>。我尝试使用 sed,但没有成功。

sed ‘s/<200b>//g’ 文件

当我使用 gedit 等图形文本编辑器打开文件时,该字符从未显示,但我使用 vim 才能看到它。

答案1

<200b> 是“零宽度空格”的 Unicode。您不会找到字符串。您可以sed像这样将字符输入管道以进行删除:

sed -i "s/$(echo -ne '\u200b')//g" file

答案2

您也可以在 VIM 中摆脱它。

%s/\%u200b// - entire file
%s/\%u200b//g - entire file, more than one occurrence on a line

答案3

我建议在任何文本编辑器中打开此文件并执行查找和替换。

查找:按住Alt并按下0 1 2 9(这将输入一个零宽度字符)。

替换:留空。

选择“全部替换”。

答案4

对于任何使用 vim 并想要删除包含此字符的整行的人,可以使用 ex 命令g

:g/\%u200b/d

相关内容