从 PDF 复制中文字符

Question

从我在您的示例文本中看到的情况来看，PDF 文件不包含中文文本的 Unicode 表示。相反，它可能使用特殊的嵌入字体来表示中文字符，并使用普通字体来表示中文拼音：

我说

应该

我说我只是说

我希望您能看出来变音符号（t īng w ǒshu ō）只是由几个字符叠放在一起构成，而表意文字则根本没有显示出来。您得到的不是U+01D2for而是for and 。ǒU+02C7ˇo

你可以通过下载并试用来轻松检查是否可以复制和粘贴以 Unicode 存储的中文符号这个文件。这是正确的 Unicode PDF，我在 Windows 7 Professional 系统（德语 MUI）上支持 Unicode 的应用程序之间复制和粘贴字符时没有任何问题。

如果这不起作用，那么您必须在系统上安装对中文字体的支持。

如果此方法有效，那么您可能可以通过检查 PDF 文件并查找嵌入的字体来找到解决方法。尝试在 Internet 上查找这些字体并将其安装在您的系统上 - 然后您将看到的不仅仅是一些毫无意义的符号。但是，这仅适用于原始中文符号；拼音无法挽救。

Answer 1