机器学习的知识框架是什么样的?

2013-02-24 18:06:41 +08:00
 winiex
最近因为毕业设计的原因,在研究 Machine Learning 相关的东西。到现在为止算是刚刚入了个门,但是由于不知道这个课题内的知识结构是怎样的,所以有种身在此山中的迷惑感。

有 V2EXer 是在做这方面的研究工作吗?求推荐介绍该领域知识框架的文章,必感谢~。

我找过一些,但是皆无果,所以很郁闷啊。或许这个领域还没有人做过总结整体知识框架的工作么==?

其它有价值的东西也求推荐啊,必感谢~。
3125 次点击
所在节点    机器学习
20 条回复
Livid
2013-02-24 18:09:18 +08:00
帮你 cc @clowwindy
winiex
2013-02-24 18:12:26 +08:00
@Livid 谢谢你~!
forest520
2013-02-24 18:14:13 +08:00
推荐两本书吧,李航的统计机器学习和刘斌的web数据挖掘
Asimov
2013-02-24 18:21:06 +08:00
winiex
2013-02-24 18:34:11 +08:00
@forest520
谢谢推荐!

我记得有评价说第一本书是国内质量的上乘之作了,不过还没有看过~。我入门看的 Mitchell 的 Machine Learning[1]。这本书数学知识设计的比较少,感觉挺不错啊!

我也找过介绍机器学习领域框架的专著过,但是还没发现比较满意的。听过搞学术的过程中,奠定一块领域的学术体系是超大的贡献之一,类似于 TAOCP 便做了算法与可计算领域这块的工作——在这之前相关的研究只是零零散散,不得章法。

现在研究机器学习的东西,就有这种感觉——涉略到的书的知识介绍是不得章法的(或许是我看的太少了还 :) )。

譬如,一个具体的问题就是,机器学习领域的细化分类是怎样的呢?单单就说监督、非监督、半监督,或者贝叶斯派、神经网络派虾米的,还是太笼统了点。暂时还找不到一个很权威的说法啊!

@Asimov
多谢~。这俩答案很赞,之前已经看过啦~,很有启发性。不过貌似没有解决我的疑惑 :)。

[1] http://book.douban.com/subject/2252153/
clowwindy
2013-02-24 19:16:10 +08:00
这个领域还在不断发展,恐怕没有一种权威的划分方法。只是大体了解一下有哪些研究方向的话,维基百科上已经写的不错了:

http://en.wikipedia.org/wiki/Machine_learning
lookhi
2013-02-24 19:42:37 +08:00
@winiex 最近因为毕业设计的原因,在研究 Machine Learning 相关的东西。到现在为止算是刚刚入了个门。还来的及吗?时间太短了吧。
ayang23
2013-02-24 20:08:40 +08:00
《模式分类》很经典的书,很容易理解。
winiex
2013-02-24 20:26:41 +08:00
@clowwindy
维基页面的质量很高,谢谢你!请问能不能给类似于我这样刚入门的童鞋一些初学建议或者指引啊?多谢了!

@lookhi
我和你是一样的情况啊,就刚寒假开始整的。一些英文专著写的很通俗易懂,慢慢读就行了,来得及的!如果只求见木不见林的话,理解那些常用算法就算入门了。你可以参看这份书单[1]。

@ayang23
你是说这本书[2]吗?还是 PRML[3] 啊?

[1] http://book.douban.com/doulist/176513/
[2] http://book.douban.com/subject/4603803/
[3] http://book.douban.com/subject/2061116/
clowwindy
2013-02-24 20:39:22 +08:00
@winiex

Andrew Ng 的录像和 notes

http://v.163.com/special/opencourse/machinelearning.html
http://cs229.stanford.edu/materials.html

另外找一些数据动手实验一下吧。把标数据、提特征、训练、测试整个自己走一遍,会更有感觉一些。
winiex
2013-02-24 20:51:23 +08:00
@clowwindy
Andrew Ng 的视频公开课确实非常经典~。

如果做数据测试的话,该怎么做呢?我搜到过一个叫做 weka[1] 的工具,它可以用来进行试验。还有其它类似的工具集吗?

Weka 是用 Java 来进行测试的。听说也有 python、R 的,另外,最流行的貌似是 Matlab 啊,Andrew Ng 的课程就是用它来做作业的~。

[1] http://www.cs.waikato.ac.nz/ml/weka/
clowwindy
2013-02-24 21:10:53 +08:00
@winiex 都可以的,看用什么顺手了
ztpk
2013-02-25 04:03:33 +08:00
斯坦福CS229是很好的参考嘛,参考其讲义 http://cs229.stanford.edu/ 另外Coursera上有视频。 最近在上这门课,发现越学的深入越会觉得数学捉急,懂统计线代和一点多元微积分可能会对学习有所帮助。另外微软大牛Christopher M. Bishop的pattern recognition and machine learning也可参考。个人认为斯坦福机器学习的讲义全搞懂就算是有个知识框架了。
Ultratude
2013-02-25 06:48:30 +08:00
毕业设计?这么早。
Ultratude
2013-02-25 06:56:06 +08:00
@Ultratude 看错楼主了,认成别人了。
sxyclint
2013-02-25 07:45:36 +08:00
刘未鹏博客有推荐
ayang23
2013-02-25 10:57:07 +08:00
aurora1625
2013-03-02 21:57:16 +08:00
4楼回复内容里面的两个链接都是出自我手,我在知乎上面也回答了其他和机器学习相关的内容,你可以顺便看看。

如果说框架性的内容,任何一本教材都会告诉你框架的内容。无论你是本科毕设还是硕士毕设,都会是一个很具体的问题,应该不会涉及到框架上的东西。

至于迷惑感,我读书好多年了,我至今仍旧有迷惑感。机器学习发展太快了,半年一年不跟国际会议,再去看大家都在干嘛的时候就已经云里雾里的了,等你明白过来怎么回事,大家又都开始扑向另外的热点了。所以,还是别迷惑了,抓住具体的东西,像@clowwindy 说的一样
“找一些数据动手实验一下吧。把标数据、提特征、训练、测试整个自己走一遍,会更有感觉一些。”

至于你说的什么频数学派和贝叶斯学派,这两个学派打仗都打了好几十年了,没人能说明白。而且你入行就纠结这些,容易走火入魔的。先动手,把自己的小问题解决好,打好内功才是要义。
winiex
2013-03-03 17:21:05 +08:00
@aurora1625
多谢指教!

最近正在按照各位前辈的指教,跑数据做实验呢,对于具体的一些算法有了比仅仅看书更为深刻的理解!

如果一个领域的知识,让人刚开始就能有一个全局层面上的了解,就能够对自己所做的工作有更实在的把握,知道自己在干什么。Coding 的时候一般都有一个知识层级告诉我,所以我觉得自己做起来还是很踏实的感觉,而忽然开始研究这样一个正在发展的领域,自己摸不着自己所做的工作的性质,确实很迷惑啊 :(。

或许这就是工程和科研之间的区别之一吧 :)。

希望以后有问题了能够继续请教你,请问可以吗?
aurora1625
2013-03-03 19:03:26 +08:00
@winiex of course

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/61224

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX