Word 导入 HTML“段落”样式

Word 导入 HTML“段落”样式

希望有人能回答。断断续续已经研究了一周了。

目标:将旧的在线博客(供所有者使用)转换为 10 个 Word 文档,共计 3200 页。每个博客的每个部分都有 5 种格式(标题、日期、类型、摘要、内容)中的 1 种。文档中的每个部分都将具有相同的样式,因此只需通过样式表即可对其进行调整(即更改每个标题的字体大小)。

我目前的方法:我已经抓取了每个博客页面,并将每个页面的每个部分保存在数据库中。我的想法是从数据库中导出所有文本,并<SPAN class="...">...</SPAN>添加到每个部分并保存为文本文件。然后将文本文件导入 Word。

我是几乎成功。Word 导入样式并将其添加到样式库中,然后导入应用新样式的文本。问题是添加到库中的样式是角色样式类型。因此我可以更改字体,但不能更改段落。没有行距、没有段落间距、没有居中等等。
无论我尝试什么,我都无法让 Word 使其成为段落样式类型,这正是我需要的。除了 SPAN 之外,我还尝试了几种不同的标签。我尝试将 添加text-align: center到类中以强制 Word 将其视为段落样式,但它被忽略了。我还尝试在导入之前在 Word 中定义新样式,但文本只是导入而没有任何样式。

有人能帮忙吗?如果您想自己尝试导入,请将下面的示例代码保存到文本文件中,然后保存在 Word 中:插入 - 对象 - 来自文件的文本。 谢谢!

编辑:由于一些示例内容,我可以看到标签<LI class ="...>作为段落样式类型导入。所以我知道 Word 可以做到这一点。

 <!DOCTYPE html>
<html>
  <head>
    <style>
      .articleTitle{
        font-family: Georgia;
        font-size: 16pt;
        text-align: center;
      }
   </style>
  </head>
  <body>
    <span class="articleTitle">A few of my favorite fruits</span><p/>
  </body>
</html> 

答案1

在创建 Word 文档后,如何修改其中的 style.xml?如果您更改为 zip,然后提取 style.xml,则可以将样式的属性更改为 w:type="paragraph"。我使用空白 Word 文档进行了快速测试,创建了一个字符样式,然后修改了 xml,重新打开文档,它变成了一个段落样式,然后我可以对其进行修改。显然,只能使用 Word 文档的副本进行实验,看看会发生什么。

相关内容