若干年前有句话“干掉熊猫我就是国宝了”,现如今感觉历史在一天天重演

2016-09-06 17:54:51 +08:00
 sgissb1

无论在 v 站,还是其他技术类站点,有时会看到讨论或变相讨论“某某玩意是世上最好的”之类话题。

就连前段时间,我在做的一个图像处理的项目(用最简单的图像预处理+目标检测来识别答题卡),都被一哥们当着全公司的面说:“是不是答题卡这个项目调一下 opencv 的 api 就行了”,接着这哥们也充斥着各种雷人雷语:“以前做过机器学习,我觉得这个就很简单,可能不超过一百行或者一千行就能写出来的东西”。如果我不是和这位雷人王打过交道的话,我估计都受不了。毕竟 85 还是 82 的哥们,单身,嘴上爱挂着他们 B 公司如何如何的牛逼啥的,其实带个项目都一塌糊涂(早些年我 boss 喊我让我要么连同他的项目一起带算了,看他那么雷,还和我平级,我果断拒绝)

其实早在很多年前(刚毕业 0-2 年)的时候,我也很喜欢对某某技术、某某框架评头论足。自从后来接触了 chromium 、 webrtc 以及一个完整的音视频双向直播以后,我开始逐渐看开。

技术似乎现在被分为两类:工程类技术、科学类技术。 其实大家现在接触的,大多数是工程类技术,为了解决一类或者一群工程类问题演变出来的技术,没有谁好谁坏。只有谁更适合应对这样的场景。正如《设计模式》还是某本书前沿中说的一样:“好的构架师不会对某种设计模式评头论足,而是觉得这样的设计似乎更自然一些。”

人往往就是被一时冲昏头脑,就如我所说的那个雷人王一样,他认为我能做出来,他也一样能做出来一样。当我当着大家的面说:“我们主要在降噪、二值化和目标检测上做了一些事情时”,他居然还没有听明白时,我已经意识到他好像对部分知识的欠缺,以至于我后来和他说:“以前在学校的时候,我图像方向的,和老师搞过空域上的图像比对和图像 0矢量化压缩”时,他都还不知道放下内心的狂妄。

年纪大了一点,发现人就好叨叨。有时候很想把一些经验传播给我周围关系好的人,但发现听得进去的不多,以至于变成现实时,也还在一根筋。

今天也算是看到 v 站以及看书有感而发了。

8778 次点击
所在节点    程序员
86 条回复
9hills
2016-09-07 14:01:16 +08:00
@sgissb1 得了吧,就一个背后祥林嫂,还巴巴的不断回复找其他人的认同感,这是心理多脆弱。。
SmiteChow
2016-09-07 14:02:51 +08:00
忘了说了,倒不是攻击,我只是分类一下: uncle bob 就是追求工程极致的榜样, ying wang 和我自己应该算后面一类
tjxjj
2016-09-07 14:07:53 +08:00
也要好好磨砺一下自己的性格
和这个世界相处,真的不容易
9hills
2016-09-07 14:10:10 +08:00
@SmiteChow 我是前面一类,可能更加过一些。有些需求如果可以用非工程的办法解决,那就不用工程的办法。

再举个例子,比如某人做的答题卡识别的召回率比较低,只有 99.9%,也就是 一千份卷子中的一份需要人工识别
而从 99.9% 改进到 99.99%,可能需要耗时一个 RD 7 个工作日,价值 3000 块。

但是卷子总量只有 100w 份,也就是人工需要识别 1000 份,随便招个临时工一会就弄完了,价值 300 块。


那我会选择 2 ,只有当 2 的成本大于 1 的时候,才会选择 1
byron
2016-09-07 14:15:17 +08:00
歪个楼。
一堆扣子,基本没有特征点的这种。
要进行数量的识别,用什么思路搞比较好呢?

类似下面这种口子。

zhicheng
2016-09-07 14:46:55 +08:00
@byron 这是没特征?
sgissb1
2016-09-07 16:30:37 +08:00
@xxdd 感谢,其实我并不是非常稳重的人。

@SmiteChow 还有派系不明确自己造轮子的。别忘了他们,他们在任何行业,任何工作上都有。

@tjxjj 其实也不见得不容易,关键看遇到什么样的人。

@byron 粗略的特征好明显好不,你这是来打我的脸吗?如果你的大部分图像是这样的场景拾取的,主要问题还是要想办法去掉背景中的纹理(板凳“皮”上的纹理),接着要考虑粘连的情况。因为有些纽扣做完二值化之后可能会出现粘连的情况。简单的直接用边缘检测可能不行。另外如果颜色(伪颜色)都是确定的,也可以考虑分通道处理。

办法也很多,看你的场景了。纽扣检测和计数的我也见到很多哥们在做,不过不清楚具体的情况,没做过。
answeror
2016-09-07 16:40:47 +08:00
hinkal
2016-09-07 16:51:49 +08:00
楼主说的这种人我也遇到过,水平一般,但装逼水平满分。但是不过觉得楼主也是值得自我批判的,说白了就是看不惯年轻人藐视自己。
CTO
2016-09-07 17:35:04 +08:00
我倒是蛮懒惰、傲慢、缺乏耐性的。。
zhicheng
2016-09-07 17:44:23 +08:00
@sgissb1 这个根本不需要考虑纹理。。。
introom
2016-09-07 17:52:03 +08:00
不知道,反正只要是应用数学,我觉得都大同小异,
wanttofly
2016-09-07 17:55:28 +08:00
以前老是觉得自己太张扬,后来渐渐变得太谦卑(对,就是这个词,我觉得太合适),好像有些不自信了,逛多了知乎和大牛的个人博客,渐渐会把自己看的很低。当然了,涉及到程序的时候的自信还是很多的,哈哈。但是就感觉世界上牛人实在太多,周围牛人实在太多,自己太渣。我的这种想法是不是也有点惨
anyforever
2016-09-07 17:55:41 +08:00
楼主就是个爱操心的命(非贬义),从这几点上就能看出来对方的态度,估计再过一段时间,你们就会拉开差距,不用急。
zhicheng
2016-09-07 18:00:02 +08:00
shijingshijing
2016-09-07 18:24:23 +08:00
@zhicheng 分水岭也是玩的溜啊~ 边缘识别出来以后,考虑求取各区域的 RGB 均值,可以分出粉色和白色。

PS :现在用 Python 也可以这样玩了啊,我一直是在 C/C++下面弄 OpenCV 。
shijingshijing
2016-09-07 18:30:45 +08:00
@sgissb1 不要浪费时间。
sgissb1
2016-09-07 20:48:56 +08:00
@shijingshijing
@zhicheng

牛逼哈,我当时想到距离变换。哈哈哈哈。

不过可能是特征和原始图的关系,我赶脚 otus 不能直接做二值化(实际场景中)。看来多虑了,应该就事论事去看图。
sgissb1
2016-09-07 20:50:20 +08:00
@shijingshijing 已经那啥了,你懂的。
byron
2016-09-07 23:58:23 +08:00
@sgissb1 嗯,这一张是比较好识别的。
现在的需求是,固定的摄像头实时监控,之后点一个按钮,会抓拍一张照片,然后识别这张图片上的扣子数量。
而这张图片可能由于光线原因、角度原因,造成的扣子大小、颜色都会有不同。

我之前的做法是,阈值变换后,计算边缘,算有多少个圆。相连部分就来计算面积。

现在的问题就是必须固定摄像头,固定角度,高度,光线环境差不多一定,才可以很好的识别。

我们想达到的目的是,不论啥设备,啥分辨率,对焦,都不考虑,随手一拍即可完美识别。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/304362

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX