从 Feynman Lectures 的 HTML 版本中提取 LaTeX 源代码?

从 Feynman Lectures 的 HTML 版本中提取 LaTeX 源代码?

加州理工学院将第一卷经典费曼物理学讲义以 HTML 格式在线发布,使用 MathJax 呈现 LaTeX 公式,使用 SVG 呈现图形图像。这很酷,而且看起来他们在从原始书籍格式转换方面做得相当不错:

无论如何,我实际上更喜欢以 PDF 格式阅读这些讲座,使用 TeX 排版并使用 TeX 字体和 TeX 的精细排版。以编程方式从网页中提取所有源公式、文本和图像并将它们转换为 LaTeX 源文件需要做什么?

这个问题的一个答案中有一个很好的工具列表:

但在深入探索这些之前,我想知道是否有人可以通过观察 Feynman 转换 HTML 源来推荐一种解决方案。

相关内容