数据挖掘新手,有以下需求:
几十万个微博用户,几百万条微博
需要给定一个用户,然后推荐相似的用户。
什么是相似?
有共同爱好
不知道如果给你这样一个需求,会怎么做?
我现在的做法特别 Low:
使用 http://bosonnlp.com/ 分词和词云来提取一个人所有微博的关键字,然后选取低频的词汇,然后通过这些词汇去找人。
但出现一些情况:
哎,大家有什么好的思路吗?数据挖掘新手,希望大家赐教。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.