如何获取 PDF 文件中某些字符的 Unicode 代码和符号名称?

如何获取 PDF 文件中某些字符的 Unicode 代码和符号名称?

我有一个包含一些 Unicode 字符的 PDF 文件(见图)。

在此处输入图片描述

我可以将这些字符复制到剪贴板并插入,例如,MS Word,我看到该字符是一个带有问号的方块,可能是因为我的系统上缺少相应的字体。

我想要的是获取 UTF 中的字符代码及其名称。我怎样才能获取它们?以下是我感兴趣的字符——也许可以直接识别它们?无论如何,PDF 和 Unicode 的通用解决方案会很棒。

答案1

在 MS Word 中,将光标放在字符后面并输入 Alt X(即按住 Alt 键的同时按下 X 键)。在任何较现代的 Word 版本中,这会将字符转换为其 Unicode 代码编号。要获取名称,您可以访问http://www.unicode.org或者使用 Windows 中的字符映射程序。或者您可以安装BabelPad,一个出色的 Unicode 编辑器,当您将光标移到每个字符前面时,它会显示每个字符的 Unicode 编号和 Unicode 名称。

或者,为了获得更多乐趣,您可以使用http://shapecatcher.com/并绘制字符。对于简单的图案,这种方法相当有效。它立即从我相当笨拙的绘图中识别出您的第一个字符是“带有右上象限的白色方块”U+25F3。

相关内容