希望有人能回答。断断续续已经研究了一周了。
目标:将旧的在线博客(供所有者使用)转换为 10 个 Word 文档,共计 3200 页。每个博客的每个部分都有 5 种格式(标题、日期、类型、摘要、内容)中的 1 种。文档中的每个部分都将具有相同的样式,因此只需通过样式表即可对其进行调整(即更改每个标题的字体大小)。
我目前的方法:我已经抓取了每个博客页面,并将每个页面的每个部分保存在数据库中。我的想法是从数据库中导出所有文本,并<SPAN class="...">...</SPAN>
添加到每个部分并保存为文本文件。然后将文本文件导入 Word。
我是几乎成功。Word 导入样式并将其添加到样式库中,然后导入应用新样式的文本。问题是添加到库中的样式是角色样式类型。因此我可以更改字体,但不能更改段落。没有行距、没有段落间距、没有居中等等。
无论我尝试什么,我都无法让 Word 使其成为段落样式类型,这正是我需要的。除了 SPAN 之外,我还尝试了几种不同的标签。我尝试将 添加text-align: center
到类中以强制 Word 将其视为段落样式,但它被忽略了。我还尝试在导入之前在 Word 中定义新样式,但文本只是导入而没有任何样式。
有人能帮忙吗?如果您想自己尝试导入,请将下面的示例代码保存到文本文件中,然后保存在 Word 中:插入 - 对象 - 来自文件的文本。 谢谢!
编辑:由于一些示例内容,我可以看到标签<LI class ="...>
作为段落样式类型导入。所以我知道 Word 可以做到这一点。
<!DOCTYPE html>
<html>
<head>
<style>
.articleTitle{
font-family: Georgia;
font-size: 16pt;
text-align: center;
}
</style>
</head>
<body>
<span class="articleTitle">A few of my favorite fruits</span><p/>
</body>
</html>
答案1
在创建 Word 文档后,如何修改其中的 style.xml?如果您更改为 zip,然后提取 style.xml,则可以将样式的属性更改为 w:type="paragraph"。我使用空白 Word 文档进行了快速测试,创建了一个字符样式,然后修改了 xml,重新打开文档,它变成了一个段落样式,然后我可以对其进行修改。显然,只能使用 Word 文档的副本进行实验,看看会发生什么。