如何从我的文件中删除多个单词中的某些字符?

如何从我的文件中删除多个单词中的某些字符?

我正在制作一个随机的 CK2(十字军之王 II)角色生成器,经过几天的努力,我成功(在一些帮助下)将 CK2 游戏目录中的文化文件解析为 JSON 文件,现在所有内容都已组织好。

但是很多词都是这样的,"Helena_Helen"或者"Inga_Inge"所以我的问题是,如何使用 Notepad ++ 正则表达式删除下划线字符和该字符后的文本,并且名称中随机位置有一些随机数字和字符。

有没有办法也可以删除它们(例如:Ad\u00e0mu_Adam 或 Ad\u00e9mar_Ad\u00e9mar)?

以下是该代码的简化示例:

 "norse": {"male_names": ["Ale", "Alfr_Alf", "Alfgeir", "Anders_Andrew", "Anlaufr", "Anundr_Anund", "Arnbj\u00f6rn", "Arngrimr", "Arni_Arne", "Arnfast", "Asbj\u00f6rn_Asbj\u00f6rn", "Bagge", "Baldr_Balder", "Barid", "Bengt_Benedict", "Bersi", "Bertil_Berthold", "Birger", "Bj\u00f6rn_Beorn", "Bo", "Borkvard", "Botulfr_Botulf", "Bragi_Brage", "Bu\u00f0li", "Dag", "Dan", "Dyre", "Eilif", "Egill_Egil", "Emund", "Einarr_Einar", "Eirikr_Erik", "Eskild", "Falki", "Faste", "Filip_Philip", "Fredrik_Frederick", "Frirek", "Fro\u00f0i_Frode", "Freyr_Frej", "Folki_Folke", "Gandalfr", "Geirr", "Georg_George", "Gnupa_Gnupa", "Gorm_Gorm", "Greger_Gregory", "Grimr_Grim", "Gu\u00f0fri\u00f0_Godfrey", "Gu\u00f0mundr_Gudmund", "Gu\u00f0r\u00f6\u00f0r_Gudr\u00f6d", "Gunnarr_Gunnar", "Hakon_Hakon", "Halsten", "Haraldr_Harold", "Haukr", "Helgi_Helge", "Hemming", "Holmger", "Hrafn", "Hrolfr_Rolf", "Hrane", "H\u00e6steinn", "Hjalmar_Hjalmar", "Hro\u00f0gar", "Hro\u00f0ulfr", "Hr\u00f6rekr_Rurik", "Hysing", "Ing\u00f3lfr_Ingolf", "Ingemar", "Ingjald", "Ivar_Ivar", "Jedvard_Edward", "Jon_John", "Sigur\u00f0r_Sigurd", "Starka\u00f0r_Starkad", "Steinn_Sten", "Sturla", "Styrbj\u00f6rn", "Styrkar", "Sumarli\u00f0i_Somerled", "Suni_Sune", "Sveinn_Sven", "Sverker", "S\u00e6mundr_S\u00e4mund", "\u00deordis_Thordis", "\u00deyra_Thyra"]},

更多内容请访问:https://pastebin.com/c3twKepK

答案1

可以使用以下表达式删除不含 UTF-8 特殊字符(包括下划线)的纯文本部分:

  • Ctrl+H
  • 找什么:(?=\_)(.*?)(?=\")
  • 用。。。来代替:nothing
  • 查看 环绕
  • Replace all

请注意这也与匹配_names{"male_names": [解决方法是将下划线替换为井号,然后稍后重置。

在此处输入图片描述

相关内容