首先,如果这不是问这个问题的正确地方,我深表歉意,但我想不出其他地方(也许是 Stack Overflow?)。
无论如何,我正在寻找光学字符识别软件(OCR)来处理我的笔记。问题是中间偶尔会有一个方程式,所以我一直在寻找一个可以同时处理文本和方程式的软件,并且可以在我的 Linux 系统中运行。
最终我的目标是从中创建一个 LaTeX 文件,因此如果输出已经在 LaTeX 中也不会造成什么影响,但我想这会要求太多。
我在网上找不到任何可以做到这一点的东西,但我认为这主要是因为我没有使用正确的搜索词(英语不是我的主要语言)。我确实找到了这个问题但这是四年前的事了,我认为从那时起情况已经发生了变化。
如果我能找到一个好的软件来处理笔记的文本部分,再找到另一个来处理笔记的方程部分,我就可以将它们全部放在一起了。
有人知道这样做的方法吗?
答案1
这不是 Linux 特有的,但是http://myscript.com/有一个数学手写识别应用程序,还算不错。但不确定 OCR。
答案2
我的意见是:算了吧。根据我的经验,Linux 上的 OCR 程序(gocr、tesseract、cuneiform、ocrad)都非常糟糕,即使是扫描的衬线字体也是如此。你可以完全忘记它来识别手写体。
如果有人证明我错了,我真的会很高兴。
即使在其他平台的大型商业程序上,例如 Finereader(很好,因为它允许训练难以识别的部分,以便在大型扫描中获得更好的结果并导出为更多[二进制]格式)或 Acrobat(好的,但没有功能,只是愚蠢的,但是好吧,认识)你将无法通过手写获得可接受的结果。
此外,您将没有机会使用它们中的任何一个来识别数学公式,即使是扫描的书籍也是如此。
(我知道,有些平板电脑具有一定的手写识别功能,但个人不知道任何产品名称......)
答案3
虽然这个问题很老了,但对于那些仍在寻找解决方案的人来说,我找到了一个名为的网络应用程序数学像素。你必须登录才能使用它,并且可以在浏览器上运行,因此可以在任何平台上运行,而不仅仅是 Linux。它将图像转换为数学形式,因此您至少需要一台相机(或手机)来拍照。
我对它的作用感到非常惊讶,因为它似乎(几乎)识别了我的写作——即使人类也不同意识别