从 PDF 中提取文本? 2024-11-14 • pdf 有一个 PDF 文件,主要包含文本。但是这些文本的某些部分无法选择和复制: 当我选择这个时: 所以: 终极乐观主义者 变成 最后。雾 是什么原因造成的?我能以某种方式克服这个限制吗? 答案1 这可能是因为编写 PDF 的程序已经“扁平化”了“ti”结扎变成图形线绘制/填充对象。 这可能是因为您粘贴文本的目标无法识别“ti”连字符编码。 如果您的图像代表 PDF 查看器本身中的文本选择,则第一种情况似乎更有可能出现。 从所有可能的 PDF 中提取纯文本还存在许多其他难题。 如何从嵌入子集字体的 PDF 中提取文本 如何找出 PDF 中文本不可搜索的原因(并使其可搜索) 因此,对此可能没有什么简单的解决办法。 相关内容 如何更改自定义 Beamer .sty 主题文件中块的颜色? 根据源地址选择下一跳 有没有办法忽略 pgfplots 中的轴极限计算图? MacOS - 启动时映射网络驱动器 Antivirus2009 或 Antivirus360 是否会自动安装在您的计算机上?如果是,如何安装? Windows 7 上的 VMWARE Server 2 和无效代码页错误 使用终端连接网络 如何控制桌面上“用户文件”文件夹下的内容? 部署:旧 Pod 删除选择 Raspberry Pi 能够通过 Wi-Fi 传输全高清视频吗?