如何在 GPU 中将 pdf 转换为 html?

如何在 GPU 中将 pdf 转换为 html?

我想在 GPU 中进行 pdf 到 html 的转换。

如果是集成显卡,它没有自己的 RAM。因此在这些情况下,传输开销永远不会存在。因此,在 pdf 到 html 的转换中,并行处理和文件大小是需要考虑的因素。文件大小永远不会太大。尽管如果我们使用专用卡,传输开销可能是一个问题。如果我们使用集成卡,就不会出现这个问题。

考虑到并行处理,我认为可以按页面实现并行化。这样可行吗?

是否有任何并行或 GPU 实现 pdf 到 html 的转换?(到现在我找不到任何一个)

我已经发帖https://stackoverflow.com/questions/36199864/how-to-parallelize-pdf-to-html-conversion-on-gpu

帖子描述说,这是不可行的。但我不清楚为什么不可行。我们可以按页面并行化。为什么我们不能这样做?

为什么我们不能在 GPU 中进行这种转换?

NVIDIA 有没有发布有关此问题的白皮书?(我一个也没找到)

此时任何想法都会非常有用

提前致谢

答案1

OCR 可以在 GPU 中完成,但使用 GPU 并不一定会使其他组件运行得更快。您的 GPU 是单指令多数据处理器 (SIMD),这意味着它可以同时对大量数据执行相同的操作。您的 CPU(假设它是多核的)是多指令多数据处理器 (MIMD),这意味着它能够同时对不同的数据执行许多不同的操作。

相关内容