@
aa45942 其实你这种属于很典型的单向思维
1.OCR确实很简单,但只能算识别文字,而不是理解;理解文字就难了,机器翻译至今还很糟糕;不妨想想音乐,音乐符号少的很,但近一个世纪以来,音乐的归类/分类却一直在变化
2.人之所以能快速辨别实物,是因为所看到的事物具有某几种特征,当特征模糊的时候就难办了,例如放个骡子或者四不象的图片?这个某种程度和下面所说第三点是一样的
3.逻辑问题,逻辑学里面判断是需要有清晰定义为前提的,定义包含内涵和外延,实物图片无法确定内涵和外延,文字则可以,因为现时的所有定义都是文字表述;例如:展示图片是猫,选择肢是狗、猫、金鱼、玫瑰、小老虎、音乐盒,如果题目没有清晰的定义“同类型”的范围(定义的内涵和外延界定),估计认为正确的答案会是五花八门,所产生的争议事后不容易处理
4.最最重要的却经常被忽视的双向问题:矛和盾。当想到对方制作矛很困难,其实也应考虑自身用同样的思维套路制作盾更困难,同样的想法,相对厉害的一方只不过是先完成(时间占优)的一方而已。计算机识别困难的情况下,产生题目也相对困难,至少需要避免置信度低的情况,那很可能也需要自己 vs 自己做一次攻防演练
我也ps:我知道图像识别的困难,从零开始当然是吃亏的(前面所说的时间落后),但你说的某些情况,其实已经有前人的努力,尤其是在学术界和特定的产业。说到底是成本和利益的衡量,我相信当中国水污染达到去污成本高于海水淡化的时候,中国会有很多海水淡化厂的
做事不能只想着别人吃亏的结果,也要更多预想自己吃亏的可能