处理乳胶?即获取文本边界框等

处理乳胶?即获取文本边界框等

我正在研究处理乳胶文档以获取页面元素坐标的可能性。

例如,如果我想获取图像的坐标或页面的标题并输出值。

诸如边界框、字符/文本/图像位置等。访问层次结构,例如标题、图像标签等。

是否有任何库(python、c++ 等?)或 tex 编辑器可以让我做这种事情?或者我最好处理 pdf?

相关内容