CAD 智能识图预处理图片分割问题请教

2023-10-31 09:57:54 +08:00

3297269

坐标设计院，应科改要求，领导想做一些智慧创新的东西，被临时抓来干活。。。想实现的是 CAD 智能识图功能，我想的第一步是，在图纸上标注出说明/尺寸标注/表格等图元，通过深度学习，达到识别图元区域并输出，后续再对输出的区域做 OCR 识别。现在我手头有 1000 张左右的 CAD 扫描图纸，分辨率极高，尺寸大约是 12000×8000 像素。我尝试着标注了几十张，将其 resize 到 640×640 像素，图纸直接马赛克了，看不清任何信息...学习的效果也非常非常差。

我有几个问题请教，希望能给我一个大概的思路 1.该怎样对图片做预处理以在不丢失过多特征的前提下缩减像素？如果直接简单粗暴将每张图裁剪为等大的几份，会有一些图元被分割，这样影响学习效果吗？是否有开源项目可以裁剪出有内容的几小块，将空白舍弃？ 2.如果学习时将图片裁剪了，那么识别时是否也应该先裁剪再分别输入？这样会丢失掉被分成两段的图元信息吗？ 3.是否有现成的轮子可参考？问的问题非常小白，各位大佬不吝赐教，感谢！！

标注完的 CAD 图纸大概长这样 https://imgur.com/a/HYDdEQz

689 次点击

所在节点

机器学习

6 条回复

tool2d

2023-10-31 10:04:38 +08:00

你先把大图用传统的图片处理方法，分割成一小部分一小部分。这样才好有针对性训练图片分类吧。

话说你这个需求，和带表格的 OCR 感觉没啥区别了。

alexsz

2023-10-31 10:12:26 +08:00

这么大的图，就算模型已经训练出来了，实际检测的时候上传图片要不少时间吧

3297269

2023-10-31 10:35:09 +08:00

@alexsz 实际检测时应该在本地，不上传

3297269

2023-10-31 10:36:28 +08:00

@tool2d 请问如果训练时分割了图片，使用时用完整图片，效果会不好吗？

paopjian

2023-10-31 10:39:12 +08:00

没搞懂你的需求,你现在是需要分割图片吗?我看图片上这些留白都很清楚,那直接用传统 cv 的侵蚀扩展再配合 reseiz 不就可以标记出图片的位置,再微调下边框就可以切出来了
或者直接试试 paddleocr 那个 PP-Structure 直接分析图标结构?

3297269

2023-11-01 09:13:37 +08:00

@tool2d
@paopjian
谢谢，我先去学习了解一下

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/986964

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX