我有一个 pdf 文件,我需要从中获取小块数据。它的结构如下:
第1页:
问题 1
.........................................
.........................................
问题2
.........................................
.........................................
頁尾
我想将问题 1 和问题 2 作为单独的 html 文件,其中包含文本和图像。
我试过了
pdftohtml -c pdffile.pdf output.html
我得到了包含 png 图像的文件,但如何将图像切分成更小的块以适合每个问题的大小(我想将每个问题分成单独的文件)?
答案1
有一个名为“*A-PDF split”的(商业)应用程序,它可以帮助您根据需要手动分割内容。