若干年前有句话“干掉熊猫我就是国宝了”,现如今感觉历史在一天天重演

2016-09-06 17:54:51 +08:00
 sgissb1

无论在 v 站,还是其他技术类站点,有时会看到讨论或变相讨论“某某玩意是世上最好的”之类话题。

就连前段时间,我在做的一个图像处理的项目(用最简单的图像预处理+目标检测来识别答题卡),都被一哥们当着全公司的面说:“是不是答题卡这个项目调一下 opencv 的 api 就行了”,接着这哥们也充斥着各种雷人雷语:“以前做过机器学习,我觉得这个就很简单,可能不超过一百行或者一千行就能写出来的东西”。如果我不是和这位雷人王打过交道的话,我估计都受不了。毕竟 85 还是 82 的哥们,单身,嘴上爱挂着他们 B 公司如何如何的牛逼啥的,其实带个项目都一塌糊涂(早些年我 boss 喊我让我要么连同他的项目一起带算了,看他那么雷,还和我平级,我果断拒绝)

其实早在很多年前(刚毕业 0-2 年)的时候,我也很喜欢对某某技术、某某框架评头论足。自从后来接触了 chromium 、 webrtc 以及一个完整的音视频双向直播以后,我开始逐渐看开。

技术似乎现在被分为两类:工程类技术、科学类技术。 其实大家现在接触的,大多数是工程类技术,为了解决一类或者一群工程类问题演变出来的技术,没有谁好谁坏。只有谁更适合应对这样的场景。正如《设计模式》还是某本书前沿中说的一样:“好的构架师不会对某种设计模式评头论足,而是觉得这样的设计似乎更自然一些。”

人往往就是被一时冲昏头脑,就如我所说的那个雷人王一样,他认为我能做出来,他也一样能做出来一样。当我当着大家的面说:“我们主要在降噪、二值化和目标检测上做了一些事情时”,他居然还没有听明白时,我已经意识到他好像对部分知识的欠缺,以至于我后来和他说:“以前在学校的时候,我图像方向的,和老师搞过空域上的图像比对和图像 0矢量化压缩”时,他都还不知道放下内心的狂妄。

年纪大了一点,发现人就好叨叨。有时候很想把一些经验传播给我周围关系好的人,但发现听得进去的不多,以至于变成现实时,也还在一根筋。

今天也算是看到 v 站以及看书有感而发了。

8896 次点击
所在节点    程序员
86 条回复
FrankD
2016-09-06 23:05:30 +08:00
@sgissb1 PlayBoy 的封面怎么就黄了。。。那是性感
feilaoda
2016-09-06 23:09:54 +08:00
说的挺好
Rubbly
2016-09-06 23:22:22 +08:00
降噪、二值化、目标检测这几个光是概念上来看是很简单,但是在很多应用场景中也会遇到各种问题,能解决好也不是这么简单,当然 Po 主的重点当然不在这个上面。
其他很多话还是很同意的,身边也的确遇到过这些人,是很烦。。
shijingshijing
2016-09-06 23:22:38 +08:00
@xiangtianxiao
@9hills

两位想必是在学校里面做项目用过 OpenCV 吧,二值化的算法实现也不难,确实感觉没什么技术含量。

不过,二位要是正真做过这种工程项目就知道了,真正做出健壮的应用,能够稳定的输出正确结果,远远不是二值化就能够搞定的,实际工程中要考虑到是不是误图,是不是铅笔污渍,黑框图不满到底图到什么程度算他正确,图的浓度不够怎么处理,这都是要花心思去调整图像处理和模式识别算法的。即使是二值化算法本身,阈值选取也需要大量经验积累然后才能得出的。我以前给朝日新闻做过 Adobe 的 OCR 插件,日本人提供过来的数据,让我目瞪口呆,包括纸张的色纯度、洁净度、反光度都是有大量实际数据记录的,报纸、打印纸、广告纸、牛皮纸等等都有详细的数据支持,所以最后按照他们的思路做出来的东西健壮性这一块特别强,基本上很少有漏识别、识别错误等情况。我特别佩服日本人的。

V2 上有很多用嘴巴编程的人,这是非常不好的一种现象。希望大家多一些技术性的讨论,不要一上来就这个东西不就是 xx 这种论调。很多东西都是看似容易做实难。
shijingshijing
2016-09-06 23:24:41 +08:00
9hills
2016-09-06 23:33:47 +08:00
@shijingshijing 然而你说的这些对答题卡识别来说,并不是很困难。

图像处理水很深,但也不要随便拿一个题目就开始好么。你说这么多也不过是在用嘴巴编程罢了。
shijingshijing
2016-09-06 23:36:27 +08:00
@9hills 真的么?你做一个答题卡识别的看看? show me the code and result.

看你的资料和以前发的帖子,我估计我们的对话到此为止了。
9hills
2016-09-06 23:41:17 +08:00
@shijingshijing 你也可以 show me your code ,愣是吹一个简单的东西,也是呵呵
9hills
2016-09-06 23:42:53 +08:00
@shijingshijing 另外既然让我写,那你总得给我提供原图吧,我图像处理虽说外行,但也想试试

别怂哈
bengol
2016-09-06 23:45:01 +08:00
lz, why are you so diao
levn
2016-09-07 09:05:58 +08:00
好无聊额
sgissb1
2016-09-07 11:07:11 +08:00
@FrankD 这怎么就只是封面呢?明显是一部视频好不?

@Rubbly 感谢,确实概念简单的飞起。不过真心研究一下,还是有很多东西的。降噪就够玩一壶了。

@shijingshijing
@9hills
二位消消气,不要再继续争论了。任何工程问题有简单的做法,也有复杂的做法。就如人脸识别,目标检测一样,最简单就是 opencv 的例子抄一下,然后套个 svm 就可以忽悠用户了。

但从实际场景出发去看的,有点不一样的。我们的答题卡主要是在普通的 a4 a3 纸张( 70g )上使用,然后给 teenage 的少年们用,所以真正难点有很多。大家都曾经年轻过,知道我们当年如何的调皮的。

我没有把我们答题卡项目讲的太细,那是我不想说太多这方面,我只想表达。人不能太狂,无知和有知是区别的,我也遇到过一些真大神,他们的谦逊和代码写起来犹豫说普通话一样自然,我也很诧异的。往往无知的人才喜欢那啥啥。

另外答题卡识别有很多识别方式和场景,只是老板不想用高考哪种方式,要不然也不需要我去做。

另外 9hills ,劝你一句,你确实是图像处理的外行(至少从你以往的帖子和你的 github 上看),我也是外行。但我已经说了,你想试试你就发简历来,音视频编解码方向的也可以。


@bengol 我当年热血了一把,在某信上注册了,然后 id 就是:i am just so diao 。。。。
sgissb1
2016-09-07 11:07:33 +08:00
@feilaoda 谢谢哈
sgissb1
2016-09-07 11:10:27 +08:00
@wizardforcel 如果用机读卡还用 opencv ,那我觉得脑子是不是有点问题。不过问题是,我们的场景使用图像拾取设备。^_^
weisdong
2016-09-07 11:12:23 +08:00
做开发 还要涉及到数学啊,我现在知道为毛程序猿没有女的了,当年分文理科时 很多女生选择文科了。
sgissb1
2016-09-07 11:15:03 +08:00
@shijingshijing
@9hills

另外我说一下,我这边的参数大部分都是动态的,不是我在程序里写死的电话号码。我组里有个研究生哥们,号称做音视频很吊的,给他自己一个人用 opencv 做,事实上什么都做不出来,成天就想着趁我不在的时候,拷贝我的 demo 代码。

然后给了他 demo ,也还是做不出来,连我怎么做的都不知道。降噪有一个分支是自适应降噪,二值化也有一个分支是自适应二值化。

实际上好的图像处理,都在想办法做到更优的自适应,仅仅倒腾个自适应二值化就够玩的。虽然有很多自适应二值化算法,不过不能直接用。

我现在用的自适应降噪,只是我通过 matlab 瞎倒腾出来而已,学校的项目不同于商业项目,我也是在学校给老板打工多年的人,这一点我还是很清楚的。

opencv 里面有很多 api 是不能直接用的,例如他的自适应二值化,就不能满大街乱用的。
xcodebuild
2016-09-07 11:21:21 +08:00
傲慢的人无论是做工程还是做学术都会自以为是,瞧不起其他人(或者其他人从事的事情)。
9hills
2016-09-07 11:54:00 +08:00
@sgissb1 呵呵,传统答题卡开始转进成不同的场景。还投简历,你能开出 80w/year 的薪资再说吧
laoyuan
2016-09-07 12:09:04 +08:00
笑眯眯的回应:“是啊是啊,可惜这次交给我们做了,下回一定让你们做。”
是不是显得情商比较高?
xiangtianxiao
2016-09-07 12:11:56 +08:00
lz 如果公司允许的话,发个图看看呗。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/304362

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX