如何删除 notepad++ 中明显的控制字符?

如何删除 notepad++ 中明显的控制字符?

我在 notepad++ 中有一些我从未见过的条目。我在许多行中突出显示了带有SGCI SSA PU1 PU2 MW和的方块SPA,如果在此处复制/粘贴,则所有内容都会翻译/变成“

我正在寻找一种方法来从条目中删除这些字符。Google 表示它们是“控制字符”,但这些字符太多了,我无法手动尝试删除。

尝试过[\x00-\x09\x0B-\x0C\x0E-\x1F]但显然它没有/没有覆盖有问题的字符。

在此处输入图片描述

这里有几行示例,以防我的原始帖子不够清楚。

在此处输入图片描述

这是文件本身。

https://www.dropbox.com/s/lymgnxy9p0atp8x/TrophyID.txt?dl=0

答案1

所有这些字符都是 UTF8

  • Ctrl+H
  • 查找内容:[\x{0080}-\x{0099}][\x00-\x09\x0B-\x0C\x0E-\x1F]
  • 替换为:LEAVE EMPTY或任何你想要的
  • 查看 环绕
  • 查看 正则表达式
  • Replace all

解释:

[                 # character class
    \x{0080}        # from character http://www.fileformat.info/info/unicode/char/0080/index.htm
  -               # upto
    \x{0099}        # character http://www.fileformat.info/info/unicode/char/0099/index.htm
]                 # end character class
[                 # character class
    \x00-\x09       # hex 00 to 09
    \x0B-\x0C       # hex 0B to 0C
    \x0E-\x1F       # hex 0E to 1F
]                 # end character class

您可以调整范围以准确满足您的需求。

截图(之前):

我从您的示例文件中摘取了一些行。

在此处输入图片描述

截图(之后):

在这里我使用XXX替换来查看替换完成的位置。

在此处输入图片描述

答案2

可能启用了“显示所有字符”和/或“显示空格和 TAB”。通过转到“查看”->“显示符号”,然后选择它们来禁用它们。

图片:

答案3

SGCI或者“单一图形角色介绍者”(U+0099)和PU2,或者更确切地说“私人用途二”(U+0092) 属于“Latin-1-supplement”块的一部分,从 开始[\x80-\xFF]这里你可以看到这个区块中的所有字符。

因此,要删除两者SGCIPU2您需要找到:

[\x99\x92]

替换为无。

答案4

  • Ctrl+H
  • 找什么:[\x00-\x09\x0B-\x0C\x0E-\x1F]
  • 用。。。来代替:LEAVE EMPTY
  • 查看 环绕
  • 查看 正则表达式
  • Replace all

解释:

[                   # character class
    \x00-\x09           # hexa 00 to 09
    \x0B-\x0C           # hexa 0B to 0C
    \x0E-\x1F           # hexa 0E to 1F
]                   # end character class

截图(之前):

在此处输入图片描述

截图(之后):

在此处输入图片描述

相关内容