求 OCR 识别固定表格内容解决方案

现在有一个需求，希望在离线环境下，针对一些固定的表格进行识别。

我现在用过 PaddleOCR 的表格识别模型，请问还有其他的更好的解决方案吗？

例如充分了利用表格板式固定的特点，基于模板进行识别，感觉重点不是在识别上，而是如何对应好内容和其意义的关系

GopherDaily

61 天前

你自己先用 opencv 之类的处理下？

opencv 识别出最外面的框之后，切割了再给 ocr ？
可以走两个 OCR 进行一次校准

cobbage

61 天前

paddleocr 有坐标的，乱的话自己排序。用 oc 切割表格出来也是排序，然后还是需要 ocr 。还有一种就是就是你表格比较有特点（类似身份证)可以训练模型借助 yolo 类的，在借助 ocr 工具。
还有个好像叫无线/有线表格识别的。（阿里模搭里面的）。
paddle 感觉好点可以自己编译别的需要调用方便点。其他移植有困难。

WuChats

61 天前

@alexsz 对的，难点确实是结构化输出，只是识别的话，很多成熟的库可以直接用了

WuChats

61 天前

@GopherDaily 嗯嗯，OpenCV 预处理有做过，效果会好一些。主要是想请教这种专门针对固定版式的表格照片的解决方案

WuChats

61 天前

@cobbage 现在基本上可以用 paddleocr 的表格识别做好结构化了，只是训练成本比较高，针对固定板式，不知道有没有更简单的方案

alexsz

61 天前

@WuChats #5 对于固格式的表格可以根据 OCR 返回的文字内容和坐标手写一套固定的解析 key/value 的方法
基本思路就是遍历文字(块) -> 找到 key -> 根据 key 文字坐标找到紧挨着的右侧或者下方的文字块作为 value

另外, 对于单元格的长度\高度\文字换行等细节需要考虑

这种方法适用于电子文档, 对于纸质拍照或扫描的表格则受到 OCR(文字和坐标)准确度的影响

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1086550

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.