另存为网页 - 列表并不总是使用 UL 或 OL html 标签保存

另存为网页 - 列表并不总是使用 UL 或 OL html 标签保存

我收到了其他人创建的包含如下列表的文档:

  • 列表项 1
  • 列表项 2

我需要将它们转换为 HTML,然后使用 Word 中的另存为网页。存在一个问题,有些列表转换为<ul><li>标签,但有些转换为

· List Item 1 
· List Item 2 

带有这个·奇怪的点字符并且没​​有<ul>标签。

<p class=MsoListParagraphCxSpMiddle style='text-indent:-18.0pt'><span
style='font-family:Symbol'>·<span style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span><span style='font-family:"Times New Roman","serif"'>56464</span></p>

产生此行为的示例文档的链接

我认为这两个列表之间唯一相关的区别是第二个(有问题的)列表有另一种样式集在功能区栏上的样式对话框中。

第一个有Normal样式,第二个也有Paragraph with a list样式。我无法在 Word 2013 中创建带样式的列表Normal- 不知道它是如何创建的。

有没有什么技巧可以修复这个问题?

答案1

似乎您的文档中有不同的格式样式。

<w:p w:rsidR="00BD738A" w:rsidRPr="00BD738A" w:rsidRDefault="00BD738A" w:rsidP="00CE27F3">
    <w:pPr>
        <w:numPr>
            <w:ilvl w:val="0"/>
            <w:numId w:val="1"/>
        </w:numPr>
        <w:jc w:val="both"/>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
        </w:rPr>
    </w:pPr>
    <w:proofErr w:type="spellStart"/>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
            <w:szCs w:val="20"/>
        </w:rPr>
        <w:t>ssssss</w:t>
    </w:r>
    <w:proofErr w:type="spellEnd"/>
</w:p>

=========

<w:p w:rsidR="00BD738A" w:rsidRDefault="00BD738A" w:rsidP="00BD738A">
    <w:pPr>
        <w:pStyle w:val="Odstavecseseznamem"/>
        <w:numPr>
            <w:ilvl w:val="0"/>
            <w:numId w:val="3"/>
        </w:numPr>
        <w:jc w:val="both"/>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
        </w:rPr>
    </w:pPr>
    <w:proofErr w:type="spellStart"/>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
        </w:rPr>
        <w:t>rrrrr</w:t>
    </w:r>
    <w:proofErr w:type="spellEnd"/>
</w:p>

您可以看到这两个 XML 块之间的区别。

我所做的是更改文档扩展名.docx。压缩并将其提取出来。

在解压的文件夹中有一个名为单词

有一个名为文档.xml包含您的文档正文内容。

解决方案: 我在word文档中选择了第一部分。

XXX:  
•   Aaaa
•   ssssss
•   xxxxxxx

并使用格式刷工具对第二部分进行格式化。

Nabízíme: 
•   rrrrr
•   asas klůsddlůask asdkllůasdklůasdklů asdlkasdlůkasdlůkadlůk asdlkasdlůasdklůasdklů  asdlkasdlůkasdlůkasdlůkasdk
•   asasasas
•   5 45464564
•   56464
•   87989789

然后将其保存为 HTML。问题解决了。

如果您方便的话,可以尝试一下。

相关内容