如何去掉图片中表格线,求教

2021-03-25 12:25:09 +08:00
 daijinming

如果包含表格线,OCR 的识别就降低,请教下大侠,如何剔除图片中的表格线

1537 次点击
所在节点    程序员
8 条回复
littlewing
2021-03-25 12:31:22 +08:00
ps 橡皮擦?
PoorBe
2021-03-25 12:32:07 +08:00
画图,选择
ch2
2021-03-25 12:46:08 +08:00
首先,把图像旋转,旋转正以后分别计算整个图像每一行每一列的像素值之和 sum
由于黑色是全 0,把那些 sum 值过低的行或者列挑出来,改成全 1
这样表格线就消除了,难点是如何判断已经旋转正了
TimePPT
2021-03-25 13:06:32 +08:00
有专门的表格 OCR
rozbo
2021-03-25 13:09:30 +08:00
卷积 L
laqow
2021-03-25 20:01:25 +08:00
转正,取阈值,然后横向一个比文本宽的 kernal open 一下得到横线,纵向 kernel open 一下得到纵线,两个并集得到表格的 mask,再减一下
alexbigbigworld
2021-03-26 00:21:29 +08:00
感觉算法滤波可以去除
daijinming
2021-03-26 12:12:43 +08:00
@laqow 厉害,感谢了朋友

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/764963

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX