基于微博、twitter 分析做一个编程语言排行榜

2014-06-28 11:09:58 +08:00
 leafonsword
现在有各种编程语言排行榜,譬如TOIBE基于谷歌、维基百科和youtube来排名,RedMonk基于github和stackoverflow来排名,但目前似乎没有基于微博、twitter海量数据这样的一个排名,我想做一个,并且将所用程序和算法公开,大家觉得怎么样?
4190 次点击
所在节点    奇思妙想
12 条回复
acpp
2014-06-28 11:14:37 +08:00
想做就做,不要问别人怎么样
acpp
2014-06-28 11:14:53 +08:00
做得出来再说
GhostFlying
2014-06-28 11:35:53 +08:00
twitter不好说,现在微博的API给的接口不一定够用来做这种分析啊,而且觉得这种SNS上很可能受到各种课程之类的影响,可能会和实际差异比较大
alexapollo
2014-06-28 13:08:14 +08:00
首先是要有微博的增量数据,入库,然后做啥都容易……
WildCat
2014-06-28 13:17:08 +08:00
微博的数据不可信
ooof
2014-06-28 13:52:18 +08:00
各种语言,每天在微博搜索一下提到的数量,算出当天的增量,j积累一段时间做比较?
missdeer
2014-06-28 14:37:38 +08:00
我对在微博上聊技术人表示常常的不屑,不管他的技术水平怎样。
ChiChou
2014-06-28 16:11:58 +08:00
这个事情好像很早以前就有人做了。

http://www.csdn.net/article/2012-02-02/311363
imcj
2014-06-28 22:23:12 +08:00
好奇,你能不能在激情褪去以前,先爬到所有的微博数据。微博API的请求有配额限制
leafonsword
2014-06-29 16:00:19 +08:00
@ChiChou
哎,还真是
jerryjhou
2014-07-01 22:27:14 +08:00
@imcj ???那自由微博是如何做到动态监控新的微博,并且筛选被屏蔽或删除的?
imcj
2014-07-04 11:46:17 +08:00
@jerryhou 不是这个事情能不能做到,而是个人基于兴趣开发产品,在爬微博数据上,就消耗了大量的精力。最后到最关键的问题上,却已经疲惫了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/119951

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX