我有一张导入的断开链接的电子表格,如下面的屏幕截图所示。我需要删除 A 列和 B 列中域名相同的行(例如屏幕截图中的第 3 行),并保留 A 列和 B 列中域名不同的行(例如屏幕截图中的第 1 行)。
我遇到的问题是,当域名相同时,URL 的其余部分不同,因此我无法根据精确匹配进行排序。我该如何根据域名的部分匹配进行排序,以便摆脱域名匹配?
答案1
一般来说,使用公式在新列中提取列的相关部分并进行排序、过滤或计数。
更具体地说,您应该能够找到一个公式来帮助您提取 URL 的域。这是其中之一在 MrExcel 上,复制于此以供参考。这个分为 2 个公式(您需要使用 2 列)以删除前(http://)和后分别地。
如果你的 URL 在 A1 中,则在 B1 中:
=MID(A1,FIND("//",A1)+2,FIND("/",MID(A1,FIND("//",A1)+2,255))-1)
在 C1 中:
=IF((LEN(B1)-LEN(SUBSTITUTE(B1,".","")))=1,B1,MID(B1,FIND("|",SUBSTITUTE(B1,".","|",(LEN(B1)-LEN(SUBSTITUTE(B1,".",""))-1)))+1,255))