如何从pdf中提取图案并保存到文本文件

如何从pdf中提取图案并保存到文本文件

如何使用 shell 将 PDF 文件中包含的某些模式提取到文本文件?

答案1

PDF 是一种格式化数据,您无法在 shell 中访问其内容,但如果您安装了poppler-utils,那么您可以convert使用它来文本并搜索您的模式grep

pdftotext my.pdf - | grep 'your_pattern' > example.txt

因此您的文件里就有您的模式example.txt

相关内容