Notepad++ 删除整个大文件中变量前后的所有内容

Notepad++ 删除整个大文件中变量前后的所有内容

我有大量文本文件,其中包含各种字符、符号和数字。我可以使用 notepad++ 批量处理这些目录并删除变量前后的所有内容吗?

我需要找到这个变量,它可以是数字或文本,然后删除它前后的所有内容。紧挨着左边和右边的文本将相同,它将始终是“col set 001”和“thursday”。中间是变量。col set 001 和 thursday 前后将有许多行随机文本和字符。

该字符串是:

random random randomrandom random randomrandom random randomrandom random randomrandom random random<col set 001">VARIABLE<thursday> random random randomrandom random randomrandom random randomrandom random randomrandom random randomrandom random random

生成的文件应该是一个 txt 文件,其中仅包含一个数字或单词,变量在每个文件中都不同。

答案1

您可以在 NPP 中使用正则表达式递归查找和替换给定子文件夹的所有文件中的模式。
键入 Ctrl-H 打开“搜索和替换”对话框,选择“在文件中查找”选项卡,然后输入

Find what: ^.+?<col set 001"?>(.+?)<thursday>.*$
Replace with: \1
Search mode: Regular Expression
tick ". matches newline"

该正则表达式匹配任意字符(.+),但尽可能少匹配(?),直到字符串“ <col set 001>”,然后是任意字符串(.+?),同样是非贪婪的,直到文字“ <thursday>”,然后是任何字符,直到文件末尾.*$

我添加了“001”以引号结尾的选项,尽管我认为这可能是拼写错误。".如果是这种情况,您可以省略。

替换的是与()搜索模式相匹配的内容,即变量文本。

相关内容