如题,目前手里有 1000 个条目,每个条目代表一个用户,有 20 个特征向量表示该用户行为。
我可以使用皮尔逊系数计算每两两用户间的相关系数,则该矩阵大小为 1000*1000
之后如何进行聚类呢?聚类算法有很多,哪种在当前这种条件下取得的效果比较好呢?
(为了使分类准确表达用户群体,假定预计分为 5 类,同一用户可以在多个不同类中)
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.