机器学习现在很火, 但有个疑问: 这跟普通程序员有多大关系? 或者说我们的价值在哪里

2017-01-27 04:16:24 +08:00
 eyp82

机器学习的算法, 基本就那几大类, 都是根据各种教授研究员们的论文出来的, 各种库也有了, 我们非科研人员能做的就是利用现有的深度学习 /机器学习的库给的 API, 拿一批种子数据训练一下, 然后拿另一批数据验证, 调一下参数. 然后呢? 普通程序员 /架构师在这方面的价值在哪里?

还请给专家指点.

17028 次点击
所在节点    程序员
47 条回复
tinybaby365
2017-01-27 18:25:25 +08:00
@googlebot 不要坐井底之蛙,举个看得见的技术:人脸识别, https://www.faceplusplus.com.cn/,很多公司都在使用。
googlebot
2017-01-27 18:41:40 +08:00
我 10 年前看过人脸识别,没任何难度,有个机构采集 30000 多个样本,共享出来,这个很牛,结果全世界的阿猫阿狗带会人脸识别,没有什么实际产品,

我想说人工学习的实际用途, 家里一个安全摄像头,能自动学习认识家庭成员,有陌生人时报警,

这是一个非常实际的需求,现在没有一个产品,所有家庭智能产品都在偷窥你隐私,把你的数据偷偷上传,
googlebot
2017-01-27 18:43:22 +08:00
@tinybaby365 你人脸识别牛,就搞个认识陌生人的摄像头,自动学习的
snnn
2017-01-27 18:56:38 +08:00
@ipwx 假如 batchsize 等于 1 呢?
ipwx
2017-01-27 19:27:39 +08:00
@snnn 我还是认为从原理上,它是符合那个期望的期望的式子的。只不过实践中,我觉得 batchsize 为 1 会导致很严重的收敛问题罢了。
snnn
2017-01-27 19:30:27 +08:00
@ipwx 不是。它和收敛性没有关系
tinybaby365
2017-01-27 20:26:47 +08:00
@googlebot face++的在线 demo 你可以试一试。人脸识别:识别出图片中的人脸(不在训练集中的)标记出特征点,年龄等数据。你说的案例属于人脸检测,现在的应用有: iOS 的相册, Google 照片, Lightroom 。
shijingshijing
2017-01-27 20:34:27 +08:00
这么说吧,这一块科学家、研究员相当于设计师,负责想 idea ,出蓝图;程序员相当于搬砖的民工,负责把蓝图盖成大楼。
hanbing135
2017-01-27 20:50:52 +08:00
Lz 想太多了 程序员在哪都没实际价值啊 (^0^)
googlebot
2017-01-27 22:29:56 +08:00
@tinybaby365 你根本没明白,是家庭安全产品,陌生人登门时马上报警,非常急需的一个安全产品
murmur
2017-01-28 00:06:32 +08:00
@matrix67 广告推荐国内真没有用算法的。。都是竞价排名。。一个推荐比一个垃圾 满地都是页游广告
估计最基本的关联规则都没人上
murmur
2017-01-28 00:07:20 +08:00
@ipwx PRML 里应该有一句,机器学习就两种算法,输出离散的叫分类,连续的叫回归。。
所以某种意义上真没错。。
lcqtdwj
2017-01-28 01:53:44 +08:00
我浅薄的理解,机器学习大部分还是基于统计理论,读研的时候学过,后来觉得很失望,因为并没有创新,只是计算能力和数据量的提升。现在我很怀疑自动驾驶,因为统计总有个置信度,即使可以达到 n 个 9 ,小概率事件还是有可能发生,造成灾难。
wjidea
2017-01-28 05:07:43 +08:00
举个例子吧, google 数据中心的能耗控制:

https://cdn0.vox-cdn.com/uploads/chorus_asset/file/6821533/DC_PUE.0.png
paulagent
2017-01-28 05:51:58 +08:00
@googlebot 你说急需就急需啦,做出来有几个人会买? 报警给谁,给你自己让你回家看还是报警给警察? 这种产品和国外的房屋警报系统有什么区别? 在国内这个产品能有什么市场
googlebot
2017-01-28 08:48:36 +08:00
国内盗贼还少?这摄像头放家里,家里有陌生人,就手机发消息,这东西绝对是重新定义安全监控,
northisland
2017-01-28 08:51:24 +08:00
大概程序按照原理分 2 类:

I. 基于规则的(语言解释器,编译器,支付,查询,计算平台等)
II. 基于 AI 算法的(语音输入,手写识别,阿法购)


大部分系统都是 I 类(你不希望你按规则写的代码,被不同的编译器读出不同的意思),大部分程序员从事的也都是 I 类。即使 II 类项目,也要有大量的 I 类程序作为接口。
northisland
2017-01-28 08:56:52 +08:00
机器学习套路比较深,不是李航那本蓝皮书就能概括的,起码得看懂 PRML 吧。
普通做 I 类的也别想掺和了,
做好 I 类, II 类的项目也需要 I 类的接口。

作出稳定的 II 类系统很吃功夫的。 I 类用好就很不错的,用不着羡慕 II 类。
ipwx
2017-01-28 12:24:23 +08:00
@murmur 按照这个说法,人类对于环境也不过是个反馈系统,输出的是离散(现实世界不存在无限连续值)值而已。
@lcqtdwj 从某种意义上人类的只能也不过是从观察到的数据中学习出来的。人类的推理本质也可以被贝叶斯公式概括。
eric227
2017-01-28 13:20:06 +08:00
我理解一个是 rule based, 一个是 data driven ,但都是工具;前一个需要稳定兼容,后一个需要不断学习提升,就像一个人的身体+脑子

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/337098

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX