使用 notepad++ 从文档中提取文本

Question

使用 Notepad++ 无法一步完成此操作，您可以执行以下操作：

第一步：

Ctrl+H
找什么：(?:^|\G).+?NM1\*71\*1\*(.+?)\*{4}XX\*(\d+)
用。。。来代替：$1 $2\n
检查环绕
检查正则表达式
请勿检查. matches newline
Replace all

解释：

(?:             : non capture group
  ^             : beginning of line
 |              : R
  \G            : position of last match
)               : end group
.+?             : 1 or more any character, not greedy
NM1\*71\*1\*    : literally "MN1*71*1*", asterisk have to be escaped
(.+?)           : group 1, 1 or more any character, not greedy
\*{4}XX\*       : 4 asterisks, XX, then 1 asterisk 
(\d+)           : group 2, 1 or more digit

替代品：

$1      : content of group 1
        : a space
$2      : content of group 2
\n      : line feed, you could change it for the linebreak you need

给定示例的结果：

Darbinian*Sevak 1306859178
Boonyaputthikul*Robert 1700198801
LX*1~SV2*0551*HC>G0154*250*UN*4~DTP*472*D8*20180125~REF*6R*74990810~

第二步，您必须删除最后一行。

Answer 1

使用 Notepad++ 无法一步完成此操作，您可以执行以下操作：

第一步：

Ctrl+H
找什么：(?:^|\G).+?NM1\*71\*1\*(.+?)\*{4}XX\*(\d+)
用。。。来代替：$1 $2\n
检查环绕
检查正则表达式
请勿检查. matches newline
Replace all

解释：

(?:             : non capture group
  ^             : beginning of line
 |              : R
  \G            : position of last match
)               : end group
.+?             : 1 or more any character, not greedy
NM1\*71\*1\*    : literally "MN1*71*1*", asterisk have to be escaped
(.+?)           : group 1, 1 or more any character, not greedy
\*{4}XX\*       : 4 asterisks, XX, then 1 asterisk 
(\d+)           : group 2, 1 or more digit

替代品：

$1      : content of group 1
        : a space
$2      : content of group 2
\n      : line feed, you could change it for the linebreak you need

给定示例的结果：

Darbinian*Sevak 1306859178
Boonyaputthikul*Robert 1700198801
LX*1~SV2*0551*HC>G0154*250*UN*4~DTP*472*D8*20180125~REF*6R*74990810~

第二步，您必须删除最后一行。

使用 notepad++ 从文档中提取文本

答案1

相关内容