许多作品都发布在预印本服务器上,例如arXiv 上在同行评审期刊上发表之前。由于 arXiv 可以在同行评审过程中更新,因此在 arXiv 上找到几乎完全相同的期刊文章副本是很常见的。在撰写文章时,受到推崇的包括期刊参考文献和预印本链接。
是否有一个工具可以遍历 bibtex 文件并查找条目
- 带有 arXiv:333.1234v1 预印本标识符但缺少期刊参考或
- 没有电子印刷标识符的期刊文章
并尝试填补缺失的信息?
这可以通过两种方式实现:
浏览两个 .bib 文件,一个包含预印本,一个包含期刊文章。找到匹配的对(通过比较作者和标题)并编写第三个 .bib 文件
获取 .bib 文件并使用在线资源(例如 Google Scholar、arXiv 等)填写任何缺失的字段。
虽然参考文献管理软件通常可以查找有关期刊文章的信息(例如通过 DOI)并且有时可以查询 arXiv,但我不知道有任何半自动方法可以匹配这些信息。
答案1
答案2
几年前我写了一个 Python 程序更新本质上就是这个。我偶然发现了这篇旧帖子,并决定公开这个程序。因此,我刚刚更新了一点代码,添加了一些文档和一些改进。任何想要使用它的人都可以从上面的 bitbucket 链接下载它。
我的程序实际上做的是通过使用 AMS 在 MathSciNet 中搜索论文,将缺失的字段添加到 BibTeX 数据库文件中的条目中查找。因此,它只会引起那些引用通常在 MathSciNet 上列出的论文的人的兴趣。
使用语法命令行脚本是:
bibupdate [选项]
bibtex_file
我编写该程序的主要目的是将缺失的 DOI 链接添加到我的 bibtex 数据库(用于 hypreref)。我发现它在预印本出版时填写出版详细信息也相当不错——当然是在论文被列入 MathSciNet 之后。
我最近添加了直接在 MathSciNet 上搜索的功能,前提是您已订阅。原则上,为 arXiv 添加类似功能很容易,但是,我不确定这是否值得做,因为如果 arXiv 收到来自同一 IP 地址的太多请求,它会锁定。
尽管该程序在我的 bibtex 文件(约 800 篇论文)上运行良好,但肯定会存在一些错误。欢迎反馈。