我有 LaTeX 文件,这些文件基本上是我所研究的几个子领域的当前研究概要。我希望能够从这些文件中获取 .bbl 文件并提取关键字(即“\keyw{ . . . }”字段)和摘要(即 \field{abstract}{ . . . }”),并将这些数据用于各种邪恶目的。实际上,我的测试用例远没有邪恶,因为它会从这些数据中创建 WordClouds。一旦成功,我就会有一些更有趣的想法。然而,当前的绊脚石是众所周知的第一步。
有什么帮助吗?非常感谢。
答案1
许多编程语言都有允许解析.bib
文件的软件包。
- 对于 Perl,有
Text::BibTeX
:http://search.cpan.org/~ambs/Text-BibTeX-0.80/ - 对于 python 有
BibtexParser
https://bibtexparser.readthedocs.io/ - Haskell 有自己的包,叫做
bibtex
https://hackage.haskell.org/package/bibtex - 对于 R 有https://cran.r-project.org/package=bibtex和https://cran.r-project.org/package=RefManageR
- 对于 Elisp,我发现https://github.com/joostkremers/parsebib
- 即使对于 PHP 来说,也有一些https://people.mmci.uni-saarland.de/~jilles/prj/phpBibLib/
CTAN 上也有一些工具(https://www.ctan.org/topic/bibtex-util), 例如bib2xhtml 它将.bib
文件转换为 XHTML,这样对您来说可能更容易解析。您也可以直接使用 Biber 来解决问题,这完全取决于您到底想要什么。