我有一个 PDF 文件,它是包含图片、表格和文本的表格的扫描件。
我想在文件上运行一个程序(不是在线工具),让它生成一个包含单词的 txt 文件。不太在意格式。
请注意,这不是“将 PDF 转换为忽略结构的文本”的重复,因为这指的是直 PDF 文档中的文本,而不是存储为 PDF 的扫描图像。
我有一个 PDF 文件,它是包含图片、表格和文本的表格的扫描件。
我想在文件上运行一个程序(不是在线工具),让它生成一个包含单词的 txt 文件。不太在意格式。
请注意,这不是“将 PDF 转换为忽略结构的文本”的重复,因为这指的是直 PDF 文档中的文本,而不是存储为 PDF 的扫描图像。