包含来自 URI 的源文本(例如 Wikipedia)

包含来自 URI 的源文本(例如 Wikipedia)

背景

维基百科内容相当新,而且可以免费使用。请考虑以下表格内容:

http://en.wikipedia.org/wiki/Comparison_of_web_application_frameworks#Java

问题

将 Wikipedia 的内容复制粘贴到 LaTeX 文档中,将内容从 HTML 转换为 LaTeX 是浪费的,原因如下:

  • 维基百科的内容会随着时间而改变。
  • 内容重复容易出错。
  • 手动转换 HTML 需要花费大量时间。

理想的情况是有一个包可以从给定的 URI 导入内容(例如表格数据)。对于表格,选择所需的列会特别有用。

问题

您会推荐哪些方法将内容动态包含到来自 URI 的 LaTeX 文档中?

(在 Wikipedia 案例中,表格 ID 不存在,因此从技术上来说很难找到正确的表格。尽管实现可以查找找到的第一个表格。)

想法

就像是:

\importuri{"http://en.wikipedia.org/wiki/Comparison_of_web_application_frameworks#Java"}%
  {Project,Current Stable Version,License}{table_id}

其中table_id是可选的。

URI 可以以内联方式写入(或强制自动 bibtex 输入)。

答案1

使用一些脚本,很容易将外部内容加载到 TeX 格式中。例如,我定义了一个命令\issueTitle[N],然后加载 N 的值,如下所示:

\def\issueTitle[#1]{%
\ifthenelse{\equal{#1}{166}}{PHP implementation of set_property will likely corrupt properties file}{}%
\ifthenelse{\equal{#1}{167}}{Add documentation to all model elements for ModelDoc}{}%
\ifthenelse{\equal{#1}{130}}{Automatically mark containers of deleted generated elements as overridden}{}%
...
}

翻译 URL 的代码(在我的案例中是 Google API) 转换为 TeX 可能超出了这个答案的范围,但我使用 PHP、file_get_contentsCURL 和 XML DOM。然后我有一个批处理脚本来自动更新此文件,这在我的正常构建过程中被调用。

相关内容