2010 年入行的程序猿,2015 年开始辞职做全职独立开发。因为一直对算法比较感兴趣( 15 年初还参加过 CSDN 的在线算法比赛,阴差阳错地得了第三名),所以打算做跟 OCR 有关的 app 。
当时尝试了很多算法,后面感觉深度学习是个好东西,所以 app 直接就叫“深度识别”。虽然其实没有多少深度学习的东西(-_-||)。不过原创的 OCR 识别引擎还是保留下来了。
一开始只有 OCR 文字识别(调百度的在线接口+本地 OCR 识别双引擎)的功能,后面模仿扫描全能王加入了制作 PDF 扫描件的功能。
接着看到表格识别需求比较高,自己整了个表格识别的算法。在生成不规则表格上有时候比百度的表格识别接口还厉害一点(而且百度的表格识别接口太贵了,咱也用不起啊)。分析表格采用原创算法,但是构造表格调用了 C#。
表格识别搞定后,又添加了个图片转 word 的功能。跟表格识别类似,版面分析算法是原创的,生成 word 在底层调用 C#相关的东西。
PDF 识别就比较简单了,其实就是截图+OCR 文字识别。
公式识别是调用 mathpix 的接口。毕竟业界最强,也就不考虑自己再造轮子了。
======================================================================
16 年上线 ios 版本,app store 官网链接:
https://apps.apple.com/cn/app/%E6%B7%B1%E5%BA%A6%E8%AF%86%E5%88%AB-%E6%96%87%E5%AD%97%E8%AF%86%E5%88%AB%E6%89%AB%E6%8F%8F%E5%85%A8%E8%83%BD%E7%8E%8B/id1179334124
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/693171
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.