如何使用 shell 将 PDF 文件中包含的某些模式提取到文本文件?
答案1
PDF 是一种格式化数据,您无法在 shell 中访问其内容,但如果您安装了poppler-utils
,那么您可以convert
使用它来文本并搜索您的模式grep
pdftotext my.pdf - | grep 'your_pattern' > example.txt
因此您的文件里就有您的模式example.txt
。
如何使用 shell 将 PDF 文件中包含的某些模式提取到文本文件?
PDF 是一种格式化数据,您无法在 shell 中访问其内容,但如果您安装了poppler-utils
,那么您可以convert
使用它来文本并搜索您的模式grep
pdftotext my.pdf - | grep 'your_pattern' > example.txt
因此您的文件里就有您的模式example.txt
。