我有一份包含数千行的文档。它包含按地理区域划分的标签,并且所有区域的随机行都包含非 ASCII 字符。
我有正则表达式来删除非 ASCII 字符,但它将应用于所有行,而我只希望删除日语地区的非 ASCII 字符。
我的想法是使用 JPN 标签为所有行添加书签。反向。然后隐藏所述行。运行正则表达式以清除非 ASCII,然后恢复隐藏的书签行。
不幸的是,我不知道如何管理隐藏部分。似乎可以使用 ALT+H 手动隐藏一行,甚至是一行。不幸的是,这对我的具体情况没有帮助,因为它们不是按地区排序的,需要保持这种状态。我似乎找不到一种方法来隐藏或取消隐藏大量书签行。
答案1
根据本网站,此正则表达式将匹配所有日语字符:
[ -ヿ一-龥「-○]+(?:\h*[ -ヿ一-龥「-○]+)*
解释:
[ -ヿ一-龥「-○]+ # 1 or more any japanese characters
(?: # non capture group
\h* # 0 or more horizontal spaces
[ -ヿ一-龥「-○]+ # 1 or more any japanese characters
)* # end group, may appear 0 or more times