删除特定字符串前后的所有文本

删除特定字符串前后的所有文本

我有一些类似以下的 URL

http://www.SOMEURL.com/first-category/1343381-example-text-text-text-text-2000-a.html

1343381我想要的是简单地删除数字(即 ID)前后的所有文本。

我读到我可以使用 Notepad++ 正则表达式来做到这一点。有什么想法吗?

答案1

如果我们可以假设SOMEURL并且first-category不包含数字,我们可以简单地搜索第一个非空数字字符串并删除所有其他内容。

图案:

Find what:    (.*?)(\d+).*
Replace with: \2

怎么运行的:

  • .*是任意字符串

  • ?使.* 懒惰的即匹配尽可能少的字符

  • \d+是一个非空数字字符串

  • ()组字符,其中\2指的是第二组

有关正则表达式的更多信息,请单击这里

例子:

http://www.SOMEURL.com/first-category/1343381-example-text-text-text-2000-a.html
http://www.SOMEOTHERURL.com/some-category/1343382-example-more-text-2001-b.html

被替换为

1343381
1343382

相关内容