若干年前有句话“干掉熊猫我就是国宝了”，现如今感觉历史在一天天重演

无论在 v 站，还是其他技术类站点，有时会看到讨论或变相讨论“某某玩意是世上最好的”之类话题。

就连前段时间，我在做的一个图像处理的项目（用最简单的图像预处理+目标检测来识别答题卡），都被一哥们当着全公司的面说：“是不是答题卡这个项目调一下 opencv 的 api 就行了”，接着这哥们也充斥着各种雷人雷语：“以前做过机器学习，我觉得这个就很简单，可能不超过一百行或者一千行就能写出来的东西”。如果我不是和这位雷人王打过交道的话，我估计都受不了。毕竟 85 还是 82 的哥们，单身，嘴上爱挂着他们 B 公司如何如何的牛逼啥的，其实带个项目都一塌糊涂（早些年我 boss 喊我让我要么连同他的项目一起带算了，看他那么雷，还和我平级，我果断拒绝）

其实早在很多年前（刚毕业 0-2 年）的时候，我也很喜欢对某某技术、某某框架评头论足。自从后来接触了 chromium 、 webrtc 以及一个完整的音视频双向直播以后，我开始逐渐看开。

技术似乎现在被分为两类：工程类技术、科学类技术。其实大家现在接触的，大多数是工程类技术，为了解决一类或者一群工程类问题演变出来的技术，没有谁好谁坏。只有谁更适合应对这样的场景。正如《设计模式》还是某本书前沿中说的一样：“好的构架师不会对某种设计模式评头论足，而是觉得这样的设计似乎更自然一些。”

人往往就是被一时冲昏头脑，就如我所说的那个雷人王一样，他认为我能做出来，他也一样能做出来一样。当我当着大家的面说：“我们主要在降噪、二值化和目标检测上做了一些事情时”，他居然还没有听明白时，我已经意识到他好像对部分知识的欠缺，以至于我后来和他说：“以前在学校的时候，我图像方向的，和老师搞过空域上的图像比对和图像 0矢量化压缩”时，他都还不知道放下内心的狂妄。

年纪大了一点，发现人就好叨叨。有时候很想把一些经验传播给我周围关系好的人，但发现听得进去的不多，以至于变成现实时，也还在一根筋。

今天也算是看到 v 站以及看书有感而发了。

shijingshijing

2016-09-06 23:22:38 +08:00

@xiangtianxiao
@9hills

两位想必是在学校里面做项目用过 OpenCV 吧，二值化的算法实现也不难，确实感觉没什么技术含量。

不过，二位要是正真做过这种工程项目就知道了，真正做出健壮的应用，能够稳定的输出正确结果，远远不是二值化就能够搞定的，实际工程中要考虑到是不是误图，是不是铅笔污渍，黑框图不满到底图到什么程度算他正确，图的浓度不够怎么处理，这都是要花心思去调整图像处理和模式识别算法的。即使是二值化算法本身，阈值选取也需要大量经验积累然后才能得出的。我以前给朝日新闻做过 Adobe 的 OCR 插件，日本人提供过来的数据，让我目瞪口呆，包括纸张的色纯度、洁净度、反光度都是有大量实际数据记录的，报纸、打印纸、广告纸、牛皮纸等等都有详细的数据支持，所以最后按照他们的思路做出来的东西健壮性这一块特别强，基本上很少有漏识别、识别错误等情况。我特别佩服日本人的。

V2 上有很多用嘴巴编程的人，这是非常不好的一种现象。希望大家多一些技术性的讨论，不要一上来就这个东西不就是 xx 这种论调。很多东西都是看似容易做实难。

sgissb1

2016-09-07 11:07:11 +08:00

@FrankD 这怎么就只是封面呢？明显是一部视频好不？

@Rubbly 感谢，确实概念简单的飞起。不过真心研究一下，还是有很多东西的。降噪就够玩一壶了。

@shijingshijing
@9hills
二位消消气，不要再继续争论了。任何工程问题有简单的做法，也有复杂的做法。就如人脸识别，目标检测一样，最简单就是 opencv 的例子抄一下，然后套个 svm 就可以忽悠用户了。

但从实际场景出发去看的，有点不一样的。我们的答题卡主要是在普通的 a4 a3 纸张（ 70g ）上使用，然后给 teenage 的少年们用，所以真正难点有很多。大家都曾经年轻过，知道我们当年如何的调皮的。

我没有把我们答题卡项目讲的太细，那是我不想说太多这方面，我只想表达。人不能太狂，无知和有知是区别的，我也遇到过一些真大神，他们的谦逊和代码写起来犹豫说普通话一样自然，我也很诧异的。往往无知的人才喜欢那啥啥。

另外答题卡识别有很多识别方式和场景，只是老板不想用高考哪种方式，要不然也不需要我去做。

另外 9hills ，劝你一句，你确实是图像处理的外行（至少从你以往的帖子和你的 github 上看），我也是外行。但我已经说了，你想试试你就发简历来，音视频编解码方向的也可以。

@bengol 我当年热血了一把，在某信上注册了，然后 id 就是:i am just so diao 。。。。

sgissb1

2016-09-07 11:15:03 +08:00

@shijingshijing
@9hills

另外我说一下，我这边的参数大部分都是动态的，不是我在程序里写死的电话号码。我组里有个研究生哥们，号称做音视频很吊的，给他自己一个人用 opencv 做，事实上什么都做不出来，成天就想着趁我不在的时候，拷贝我的 demo 代码。

然后给了他 demo ，也还是做不出来，连我怎么做的都不知道。降噪有一个分支是自适应降噪，二值化也有一个分支是自适应二值化。

实际上好的图像处理，都在想办法做到更优的自适应，仅仅倒腾个自适应二值化就够玩的。虽然有很多自适应二值化算法，不过不能直接用。

我现在用的自适应降噪，只是我通过 matlab 瞎倒腾出来而已，学校的项目不同于商业项目，我也是在学校给老板打工多年的人，这一点我还是很清楚的。

opencv 里面有很多 api 是不能直接用的，例如他的自适应二值化，就不能满大街乱用的。