我正在尝试寻找一种简单的方法将我的 Word 文档转换为 HTML,而无需使用内置的可怕的另存为功能。这些是结构化文档(专为我们的屏幕阅读器(JAWS)用户设计),因此它们使用标题 1、2、3、4 和目录。
我们计划将这些内容转换为 DAISY 有声读物(https://en.wikipedia.org/wiki/DAISY_Digital_Talking_Book), 因此我们需要非常干净但结构化的 HTML 来转换。
我尝试使用样式进行查找替换,但它只会替换搜索文本部分中的任何内容。我可以将其从任何一种样式转换为另一种样式,但在框中添加文本会弄乱它。
(我认为我明白 DAISY 的 CSS 意味着不仅仅是<h2>
它必须是<level2 class=='section' <h2>
(和结束标签),但这是我处理这部分之后的第 2 步。)
我只想能够使用样式 2 找到任何文本,并在该行的开头添加文本,说“是的,这是一些样式 2”,这样我就可以做 HTML/CSS 的事情了。
谢谢!
(我最初在 StackOverflow 上发布了这个,因为我不知道超级用户的存在。如果这是最好的解决方案,我很乐意添加一个 VBA 东西,但如果有一个更简单的解决方案,那也会很棒。再次感谢!)
https://stackoverflow.com/questions/54656777/find-replace-text-foo-with-style-heading-1-with-h1foo-h1