坐标设计院,应科改要求,领导想做一些智慧创新的东西,被临时抓来干活。。。 想实现的是 CAD 智能识图功能,我想的第一步是,在图纸上标注出说明/尺寸标注/表格等图元,通过深度学习,达到识别图元区域并输出,后续再对输出的区域做 OCR 识别。 现在我手头有 1000 张左右的 CAD 扫描图纸,分辨率极高,尺寸大约是 12000×8000 像素。我尝试着标注了几十张,将其 resize 到 640×640 像素,图纸直接马赛克了,看不清任何信息...学习的效果也非常非常差。
我有几个问题请教,希望能给我一个大概的思路 1.该怎样对图片做预处理以在不丢失过多特征的前提下缩减像素?如果直接简单粗暴将每张图裁剪为等大的几份,会有一些图元被分割,这样影响学习效果吗?是否有开源项目可以裁剪出有内容的几小块,将空白舍弃? 2.如果学习时将图片裁剪了,那么识别时是否也应该先裁剪再分别输入?这样会丢失掉被分成两段的图元信息吗? 3.是否有现成的轮子可参考? 问的问题非常小白,各位大佬不吝赐教,感谢!!
标注完的 CAD 图纸大概长这样 https://imgur.com/a/HYDdEQz
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.