答案1
这似乎是一个“页码块”,在 .docx 格式的 ISO 规范(ISO/IEC 29500-1 基础和标记语言参考)中描述如下:
17.3.3.22 pgNum (Page Number Block)
This element specifies the presence of a page number block at the current location in the run content. A page
number block is a non-editable region of text which shall display the current page using ascending decimal
numbers. [Note: The page number block is a legacy construct used for compatibility with older word processors,
and should not be produced unless it was consumed while reading a document – it is recommended that the
PAGENUM field is used in its place. end note]
A page number block shall be displayed using ascending decimal numbers, regardless of the languages specified
in the parent run’s lang property (§17.3.2.20).
[Example: Consider a WordprocessingML run with the following run content:
<w:r>
<w:t xml:space="preserve">This is the current page: </w:t>
<w:pgNum />
</w:r>
This run specifies that a page number block must be placed after the text string literal This is the current
page: in the document. Assuming that this content is on the first page, this run would be displayed as follows:
This is the current page: 1
(以其中一个字符开头的“run”和第一个“eumot”的 Word Open XML 代码是
<w:r><w:pgNum/></w:r><w:r><w:t>eumot</w:t></w:r>
)
我不知道源文本中的什么构造会导致这种情况,但如果您需要知道,并且它是一个 HTML 源,那么查看底层 HTML 代码应该相当容易。
如果您只是需要摆脱它们,选择字符并使用编辑->替换来替换它们(无)似乎可以删除其中一些,但不是全部。编辑:如果您使用 VBA 和 AscW(选择)来查找这些字符的字符代码,则为 0。因此,我尝试使用高级查找/替换,没有使用通配符来查找^0
并替换(无)。这似乎有效。
[[由于这一发现,您可能不需要使用我下面建议的东西:
您也许可以做到这一点,但是当我尝试时,我看到一条消息,提示某些自定义内容控件不会被保存,因此这可能不起作用。
可以从 .docx 中提取 XML 文档,删除所有 pgNum 元素,然后将其放回,但我现在没有时间描述该过程或找到有帮助的良好链接。
- 另存为 Word XML 文档 (*.xml)
- 如果可以,请使用记事本打开(这是一个很长的文档!),或者使用其他纯文本编辑器打开。
- 替换
<:pgNum/>
为无 - 节省
- 在 Word 中重新打开 ]]
答案2
同样的问题也发生在我团队的几个 Word 文档中。这些文档存储在 SharePoint 上,不仅页码出现了,而且格式和内容的其他随机更改也同时显示为已跟踪。这些更改包括大写字母更改(MPa 改为 mPa,pp 改为 Pp)、将随机单词大写以及一次用小写字母 l 替换几个字符。
据我所知,这些都发生在全局(或全局、分步)查找/替换附近。但是,查找/替换查询与所做的更改无关。我很想知道是什么原因造成的。这些文档都很成熟,从另一个文档复制/粘贴似乎不太可能是原因。