如何使用文件中找到的信息重命名数百个 PDF 文件?

如何使用文件中找到的信息重命名数百个 PDF 文件?

我将工作中的表格扫描成 PDF 文件,然后使用 Nitro 使其可搜索。

我需要想出一种方法来读取文件的前 50 个字符(这些字符始终位于文档中的同一位置,只是文本不同),然后使用这些字符中找到的信息重命名文件。
然后我需要将其保存到我们服务器上的目录中。

我搜索了一段时间,没有找到任何可以满足此需求的东西。
您知道任何可以执行此功能的代码或程序吗?

答案1

有很多方法可以用脚本来实现这一点,但是 python 是一种方便的多功能语言,几乎可以在任何平台上运行。

这是一个很好的开始手动的

这是一个你可以使用的库阅读 pdf 文件。但是也有一些 PDF 库。

您甚至可能不需要 pdf 库,而是通过直接读取文件来完成此操作。

如果您最近不熟悉脚本编写,那么在获得一些帮助之后您会更快地掌握它,但是如果您想自己尝试,那么您需要关注的主要领域是:

  1. 读取命令行参数(以便您可以传递要更改的文件名)

  2. 打开、读取和关闭文件

  3. 使用 PDF 库打开、读取和关闭文件

  4. 字符串操作——可能需要子字符串和拆分字符串

  5. 使用系统调用重命名文件

相关内容