码农如何平滑的切入数据分析领域,怎么样最靠谱?

2013-06-25 10:05:37 +08:00
 vvii
对数据的热情有一年多了。
一年前看《智能WEB算法》,模模糊糊的了解了一些概念,对于楼主这种码农来说感觉公式稍稍有点多。
最近《集体智慧编程》这本书看了一大半。对聚类,相似度计算,优化算法等等有了比较清晰的了解,感觉豁然开朗。由于此书是用python做例子,因此顺带着学习了python这门语言(代码看上去确实好看)。关注了很多人的言论,大都认为需要深入的学习数学理论。但是我感觉直接看公式成本太高了,想先根据学到的知识做点东西出来。对数据分析有一个比较系统的认知之后,再深入的学习数学。

不知道大家做了哪些有趣的数据领域的小项目?(如果是python或者php最好了,楼主只会这两门语言)
或者有没有童鞋有兴趣一起做一个数据领域的小项目?
另外,还请有经验的童鞋分享一下,码农如何平滑的切入数据分析领域,如何入门,如何深入?
6027 次点击
所在节点    程序员
7 条回复
xunyu
2013-06-25 10:50:46 +08:00
推荐几个站点
http://cos.name/
http://www.52nlp.cn/

数据分析领域现在还是以R为主,强烈推荐,建议lz先试一些流行的算法,像aprior,做一些数据挖掘,然后绘图出来
关键看个人想学哪方面的,python用来做舆情分析很不错,我在用python随机抓取了wiki上面10000篇文章做topic分类,感觉还是蛮有趣的
Nourl
2013-06-25 10:53:11 +08:00
- 学习Python/R
- 学习统计、分析
- 实战:抓点微博数据,做个应用

想分析大数据的话,还得学习:
- Python写MapReduce
- Dpark(Python版的Spark) or Hadoop
- Python写Job,挖数据

21天精通数据分析...
vvii
2013-06-26 09:31:26 +08:00
谢谢两位。

看来这个话题比较冷门。讨论的童鞋挺少。
zhaoyaodong
2013-06-26 23:21:14 +08:00
学数学,学数学,学数学。。
quake0day
2013-06-27 05:47:47 +08:00
集体智慧编程就很好,不过这本书有点太老了,还是我本科时候出的呢。
除了这本,还有Machine Learning in Action,R语言的有Machine Learning for Hackers。都是比较偏应用的。
理论方面,之前论坛里有人问过,也有牛人回答过怎么学。网上视频教程太多了。
有些数据集可以从这里下载 http://ocw.mit.edu/courses/sloan-school-of-management/15-097-prediction-machine-learning-and-statistics-spring-2012/datasets/

另外同意楼上的观点:) 当然自娱自乐的话,会调用库就行了。
davepkxxx
2013-06-27 09:23:17 +08:00
要有扎实的数学基础。
zjwzszh
2013-06-27 12:18:38 +08:00
用飘柔~~~丝般顺滑

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/73520

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX