学习机器学习一定要会推公式吗

2022-08-11 11:02:01 +08:00
 ligiggy

不推公式可以简单上手吗,比如可以把库拿过来就用?

然后,有无这类的上手书推荐。

4563 次点击
所在节点    程序员
35 条回复
MrZhaoyx
2022-08-11 14:18:23 +08:00
推荐李航老师的《统计学习方法》
xiang578
2022-08-11 15:07:16 +08:00
b 站上也有一个系列视频,手把手教你推公式:白板机器学习。
ligiggy
2022-08-11 15:48:32 +08:00
@xiang578 手把手也不喜欢推公式,过了这个年纪了。
tfdetang
2022-08-11 16:24:57 +08:00
机器学习从业者来回答这个问题: 一般只有要准备面试的时候才会去推公式
当然我比较水不能代表所有从业者。 其实大部分时候看论文什么的大概能看出是怎么回事,也能看懂就行了,关键是思路,很少真的去推公式
dabaisuv
2022-08-11 16:38:30 +08:00
谷歌的机器学习:
aHR0cHM6Ly9kZXZlbG9wZXJzLmdvb2dsZS5jbi9tYWNoaW5lLWxlYXJuaW5nL2NyYXNoLWNvdXJzZS9tbC1pbnRybw==
ipwx
2022-08-11 17:11:56 +08:00
分情况。

* 如果是用树算法处理工业数据,一般不需要推公式,调参就行。
* 如果用神经网络处理图片数据,一部分工作者不需要推公式,用 PyTorch 搞就行。
* 如果用神经网络处理自然语言,推公式的比重会增大。
* 如果处理的是无监督学习,或者顶会不怎么覆盖的新领域上做深度学习,那就得会大量原理性的东西,做各种 regularization ( loss / 结构),不会公式基本寸步难行。
ligiggy
2022-08-11 17:20:21 +08:00
@ipwx 为啥每次问问题,基本上大佬都能知道……太强了。
ligiggy
2022-08-11 17:20:58 +08:00
@ipwx 暂时我还没有应用场景,仅限于去了解一下玩玩,还没想当成自己的 工作技能。
ipwx
2022-08-11 17:24:44 +08:00
@ligiggy 其实现在 DL 比较成熟的也就 CV/NLP 。

大量工业数据没那么规整的,各种不同量纲、不同单位、不同性质的 heterogeneous data ,一般用树算法更舒服。经典的比如 RandomForest ,新锐的比如 GBDT 。除了这些树算法,还有就是 Bagging / Boosting 算法的思想得了解一下。
ipwx
2022-08-11 17:25:44 +08:00
@ligiggy 我上面举的这四个例子都不怎么需要推公式,工业数据上又比较万金油,投入产出比 DL 高。当然它们基本没法处理图片 /NLP ,CV/NLP 还是神经网络得天下。
ligiggy
2022-08-11 17:27:53 +08:00
@ipwx OK ,好的,有没有书推荐,我看了下楼上大佬推荐的 pytorch 教程,感觉挺不错的。
ipwx
2022-08-11 17:31:27 +08:00
@ligiggy ummm 很遗憾我已经脱离教材很久了。。。(今年 phd 毕业了
xz410236056
2022-08-11 17:33:41 +08:00
“比如可以把库拿过来就用”
当然可以,但是你不会相关的数据你怎么设计自己的神经网络呢?你只能用别人封装好的网络啊。

https://mofanpy.com/learning-steps/
推荐个学习网站。
rpman
2022-08-11 19:52:46 +08:00
要搭神经网络总得会推公式,不然搭出来一坨
pkupyx
2022-08-12 01:08:36 +08:00
一定要。未必背下来,但是至少知道分几块步骤,并且能看懂。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/872116

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX