从源代码中彻底提取域名

从源代码中彻底提取域名

我一直在搜索 bash 脚本来提取域名,我发现了一些使用 的提示grep,但它们只搜索某些 TLD.com或某些模式,如google([A-Za-z\-]*?\\*?)\.com.

我正在开发一个依赖于其他开源项目的项目,出于安全原因,我想彻底搜索并提取源代码中的所有域名

我想用这样的东西:https://publicsuffix.org/list/public_suffix_list.dat,这是所有公共顶级域的列表,然后从匹配所有域的整个源代码中搜索并提取public_suffix_list.dat

聚苯乙烯

  • public_suffix_list.dat有注释行,但很容易删除它们并只留下 TLS 列表
  • 对于源代码,如果递归地迭代整个源代码成本太高,彻底完成一个文件也可以,我可以生成一个文件列表并逐个完成

这对于 bash 脚本来说可能吗?谢谢你!

相关内容