从 .bbl 文件中提取“\field{abstract}{ . . . }”和“\keyw{ . . . }”字段,用于制作词云和其他类似的数据挖掘

从 .bbl 文件中提取“\field{abstract}{ . . . }”和“\keyw{ . . . }”字段,用于制作词云和其他类似的数据挖掘

我有 LaTeX 文件,这些文件基本上是我所研究的几个子领域的当前研究概要。我希望能够从这些文件中获取 .bbl 文件并提取关键字(即“\keyw{ . . . }”字段)和摘要(即 \field{abstract}{ . . . }”),并将这些数据用于各种邪恶目的。实际上,我的测试用例远没有邪恶,因为它会从这些数据中创建 WordClouds。一旦成功,我就会有一些更有趣的想法。然而,当前的绊脚石是众所周知的第一步。

有什么帮助吗?非常感谢。

答案1

许多编程语言都有允许解析.bib文件的软件包。

CTAN 上也有一些工具(https://www.ctan.org/topic/bibtex-util), 例如bib2xhtml 它将.bib文件转换为 XHTML,这样对您来说可能更容易解析。您也可以直接使用 Biber 来解决问题,这完全取决于您到底想要什么。

相关内容