是否可以使用 GhostScript 将 PDF 转换为 TXT 文件?

是否可以使用 GhostScript 将 PDF 转换为 TXT 文件?

有人想将 PDF 转换为 TXT,具体解释如下C# GhostScript - 无法成功从 PDF 转换为 TXT 文件

我不确定 GhostScript 是否可以做到这一点。有可能吗?

答案1

命令行工具pdf转文本,Xpdf 开源项目的一部分

NAME
       pdftotext - Portable Document Format (PDF) to text converter (version 3.00)

SYNOPSIS
       pdftotext [options] [PDF-file [text-file]]

DESCRIPTION
       Pdftotext converts Portable Document Format (PDF) files to plain text.

       Pdftotext  reads  the  PDF file, PDF-file, and writes a text file, text-file.  If text-file is not specified, pdftotext con-
       verts file.pdf to file.txt.  If text-file is ´-', the text is sent to stdout.

详细信息请参见pdftotext 手册页

答案2

是的。绝对有可能。使用以下批处理文件。

rem batch.bat
rem %1 represents input file name without extension.
echo off
gswin32c -q -dNODISPLAY -dSAFER -dDELAYBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f ps2ascii.ps %1.pdf -c quit >%1.txt

相关内容