有人能提供关于将 PDF 文档转换为 CAMT、适当的 XML 或 MT940 格式的信息吗?目标操作系统是 Windows 10 机器。我很感激任何有用的信息。
答案1
如果我没记错的话,这里的目标格式是银行业非常结构化的报告格式;MT490 似乎特别指的是每日结束报告。
不,PDF 不是结构化格式。除非在 PDF 中明确嵌入/附加了特定结构化文件,否则原始结构就会丢失。
OCR/文本提取方法可能在某种程度上起作用,但考虑到您似乎正在从事的领域,这不是一个选择。
有人能提供关于将 PDF 文档转换为 CAMT、适当的 XML 或 MT940 格式的信息吗?目标操作系统是 Windows 10 机器。我很感激任何有用的信息。
如果我没记错的话,这里的目标格式是银行业非常结构化的报告格式;MT490 似乎特别指的是每日结束报告。
不,PDF 不是结构化格式。除非在 PDF 中明确嵌入/附加了特定结构化文件,否则原始结构就会丢失。
OCR/文本提取方法可能在某种程度上起作用,但考虑到您似乎正在从事的领域,这不是一个选择。