BibTeX/BibLaTeX 引文格式化实用程序

Question

这是我草草写出来的。
它不会赢得任何风格奖，但对于手头的任务来说已经足够了。
欢迎您使用、修改、分发，随便什么都可以。
如果您自己写的话，它至少可以为您节省一些时间。

#!/usr/bin/env python3

import sys
import requests,urllib3
from bs4 import BeautifulSoup 

titles = []
count  = 0
with open(sys.argv[-1]) as f:
  urls = list(f)

urllib3.disable_warnings()
try:
  for url in urls:
    try:
      html = requests.get(url=url,verify=False)
      if html.status_code in (400,404):
        raise requests.exceptions.InvalidURL()
    except (requests.exceptions.InvalidURL):
      continue
    except (requests.exceptions.ConnectionError):
      continue

    soup = BeautifulSoup(html.text,'lxml')
    try:  
      title = soup.find('title').string
      titles.append(title)
      print('@misc{'+str(count)+',')
      print('    url   = '+url,end='')
      print('    title = '+title,end='\n}\n')
      count += 1
    except (AttributeError):
      continue 
except (KeyboardInterrupt):
  print(); exit()

Answer 1

这是我草草写出来的。
它不会赢得任何风格奖，但对于手头的任务来说已经足够了。
欢迎您使用、修改、分发，随便什么都可以。
如果您自己写的话，它至少可以为您节省一些时间。

#!/usr/bin/env python3

import sys
import requests,urllib3
from bs4 import BeautifulSoup 

titles = []
count  = 0
with open(sys.argv[-1]) as f:
  urls = list(f)

urllib3.disable_warnings()
try:
  for url in urls:
    try:
      html = requests.get(url=url,verify=False)
      if html.status_code in (400,404):
        raise requests.exceptions.InvalidURL()
    except (requests.exceptions.InvalidURL):
      continue
    except (requests.exceptions.ConnectionError):
      continue

    soup = BeautifulSoup(html.text,'lxml')
    try:  
      title = soup.find('title').string
      titles.append(title)
      print('@misc{'+str(count)+',')
      print('    url   = '+url,end='')
      print('    title = '+title,end='\n}\n')
      count += 1
    except (AttributeError):
      continue 
except (KeyboardInterrupt):
  print(); exit()

BibTeX/BibLaTeX 引文格式化实用程序

答案1

相关内容