我有一个包含大量文本的文档。我想标记所有以 .se 结尾的 URL
我设法用 标记了 URL 中 .se 之前的部分\w+\.se
。但其中一些 URL 有 3-4 个子域名。
因此,如果我有 example.example.example.se,我设法标记最后一个 example.se,但我想标记它全部。
编辑:为了清楚起见,我需要标记所有 URL 以对其进行谴责。使用 \w+.se 将标记“example.example.se”中的“example.se” \w+.\w+.se 不会标记仅为“example.se”的 URL,但它会标记“example.example.se
一开始我以为我可以对每一组子域名都执行一次。但问题是编辑中的第一个示例。它将替换域名的后半部分,但第一个子域名将保留,我无法在链中运行序列。因为那将是“example.censured”(以前是“example.example.se”)。
我说得有道理吗?不知道如何用语言表达这个问题……
答案1
只需\w+\.
重复该部分:(\w+\.)+se
。