从 PDF 中提取文本? 2024-11-14 • pdf 有一个 PDF 文件,主要包含文本。但是这些文本的某些部分无法选择和复制: 当我选择这个时: 所以: 终极乐观主义者 变成 最后。雾 是什么原因造成的?我能以某种方式克服这个限制吗? 答案1 这可能是因为编写 PDF 的程序已经“扁平化”了“ti”结扎变成图形线绘制/填充对象。 这可能是因为您粘贴文本的目标无法识别“ti”连字符编码。 如果您的图像代表 PDF 查看器本身中的文本选择,则第一种情况似乎更有可能出现。 从所有可能的 PDF 中提取纯文本还存在许多其他难题。 如何从嵌入子集字体的 PDF 中提取文本 如何找出 PDF 中文本不可搜索的原因(并使其可搜索) 因此,对此可能没有什么简单的解决办法。 相关内容 无法通过端口 443 访问虚拟主机 PC行为非常奇怪 如何启动/运行 .mount 文件 (systemd) 避免在执行批处理文件的文件中输出数字 x> 配备 AMD Radeon HD 6650M 显卡的 Sony Vaio Z Power Media Dock 值得购买吗? 在 Steam 客户端之外运行游戏时出现“lib”问题 如何使用 Windows 截图工具去除水印(Windows 8) 渐变中的自定义填充图案 华为和 TP-LINK 之间的静态路由不起作用 在 Ubuntu 16.04 桌面上为 VPN 客户端配置隧道适配器?