从文件中提取 URL 链接

Question

您的正则表达式有两个错误，一个是.在第一个之前缺失的*，另一个是?在结尾附近多了一个。

urlsort这里是一些使用一些 Python 习语来编写与您的模式匹配的 URL 的代码。

#!/usr/bin/env python

import re

with open('urlfile', 'r') as urls_in:
    with open('urlsort', 'w') as urls_out:
        for line in urls_in:
            links = re.findall(r"(\/support\/security\/bulletins\/.*.html)", line)
            if links:
                urls_out.write("%s\n" % links[0])

Answer 1

您的正则表达式有两个错误，一个是.在第一个之前缺失的*，另一个是?在结尾附近多了一个。

urlsort这里是一些使用一些 Python 习语来编写与您的模式匹配的 URL 的代码。

#!/usr/bin/env python

import re

with open('urlfile', 'r') as urls_in:
    with open('urlsort', 'w') as urls_out:
        for line in urls_in:
            links = re.findall(r"(\/support\/security\/bulletins\/.*.html)", line)
            if links:
                urls_out.write("%s\n" % links[0])

从文件中提取 URL 链接

答案1

相关内容