查找并匹配相应的 arXiv 预印本和期刊文章

查找并匹配相应的 arXiv 预印本和期刊文章

许多作品都发布在预印本服务器上,例如arXiv 上在同行评审期刊上发表之前。由于 arXiv 可以在同行评审过程中更新,因此在 arXiv 上找到几乎完全相同的期刊文章副本是很常见的。在撰写文章时,受到推崇的包括期刊参考文献和预印本链接。

是否有一个工具可以遍历 bibtex 文件并查找条目

  • 带有 arXiv:333.1234v1 预印本标识符但缺少期刊参考或
  • 没有电子印刷标识符的期刊文章

并尝试填补缺失的信息?

这可以通过两种方式实现:

  1. 浏览两个 .bib 文件,一个包含预印本,一个包含期刊文章。找到匹配的对(通过比较作者和标题)并编写第三个 .bib 文件

  2. 获取 .bib 文件并使用在线资源(例如 Google Scholar、arXiv 等)填写任何缺失的字段。

虽然参考文献管理软件通常可以查找有关期刊文章的信息(例如通过 DOI)并且有时可以查询 arXiv,但我不知道有任何半自动方法可以匹配这些信息。

答案1

总的来说,这是一个非常难的问题。(几年前我花了一些时间研究这个问题,但没有太多具体成果。我觉得很难!)MathSciNet 和 arXiv 上的元数据经常不匹配 --- 摘要和标题经常变化,令人惊讶的是,甚至作者姓名也不完全匹配。

如果有人想再次尝试,主要工具是 MathSciNet 的参考文献。如果采用另一种方法(查找与已发表文章相对应的 arXiv 预印本),您将获得更少的帮助。我的方法只是建立一个数据库,其中包含我的软件执行的所有成功的 MRef 查找!

我确实编写了一些非常基本的脚本来自动从 MathSciNet 导入 BIBTEX,详情如下秘密博客研讨会

答案2

几年前我写了一个 Python 程序更新本质上就是这个。我偶然发现了这篇旧帖子,并决定公开这个程序。因此,我刚刚更新了一点代码,添加了一些文档和一些改进。任何想要使用它的人都可以从上面的 bitbucket 链接下载它。

我的程序实际上做的是通过使用 AMS 在 MathSciNet 中搜索论文,将缺失的字段添加到 BibTeX 数据库文件中的条目中查找。因此,它只会引起那些引用通常在 MathSciNet 上列出的论文的人的兴趣。

使用语法命令行脚本是:

bibupdate [选项]bibtex_file

我编写该程序的主要目的是将缺失的 DOI 链接添加到我的 bibtex 数据库(用于 hypreref)。我发现它在预印本出版时填写出版详细信息也相当不错——当然是在论文被列入 MathSciNet 之后。

我最近添加了直接在 MathSciNet 上搜索的功能,前提是您已订阅。原则上,为 arXiv 添加类似功能很容易,但是,我不确定这是否值得做,因为如果 arXiv 收到来自同一 IP 地址的太多请求,它会锁定。

尽管该程序在我的 bibtex 文件(约 800 篇论文)上运行良好,但肯定会存在一些错误。欢迎反馈。

相关内容