将包含 MathType 公式的 MS Word 文档转换为 HTML

将包含 MathType 公式的 MS Word 文档转换为 HTML

我的任务是将 MS Word 文档 (*.docx) 转换为 HTML 文件。此 Word 文档包含许多用 MathType 编写的公式。以下是与 Word 文档类似的虚拟文本:

在此处输入图片描述

我尝试将文档保存为网页,但最终得到以下结果:

在此处输入图片描述

这些公式被转换成低分辨率图像并且看上去很不美观。

有没有一种方法可以在不手动重新创建 HTML 原始文档的情况下获得令人满意的结果?

我必须承认我在这个领域完全是个新手。

答案1

如果您仍在寻找解决方案,我最近更新了我的 Word docx 到 html 转换器,现在可以识别数学方程式并在网页上正确显示它们。我使用 Mathjax 的在线版本,以便能够轻松地在网页上显示数学方程式。这是一个简单的 php 类,它将 docx 文件作为输入并将其输出为 html 以显示在网页上和/或保存到文件中。

我刚刚添加了这个功能,所以可能还存在一些问题。如果发现任何问题,我很乐意为您调查并纠正。

要了解更多信息并下载我的“wordtohtml”php 类,请参阅: https://github.com/timy352/wordtohtml 或者 https://www.phpclasses.org/package/12250-PHP-Convert-Microsoft-Word-DOCX-document-to-HTML.html

相关内容