求助:高维数据聚类合适算法。

2012-03-08 21:28:41 +08:00
 cristie
想来想去,都觉得高维数据聚类太坑爹。我这里需要解决的1000维度以上的数据点有上万个,神马算法都是坑爹的慢。嘛,于是我想要高人叫我一个方法,恩,能够对维度1000+的数据进行聚类。

我看到一个文章,恩,《基于k最相似聚类的子空间聚类算法》,我想试试这个算法,有没有人能告诉我这个算法在这个问题上可行性如何?

另外,如果大量数据要使用抽样的方式进行聚类,应该如何操作?一头雾水啊。
4229 次点击
所在节点    程序员
4 条回复
wellsho
2012-03-10 23:17:11 +08:00
去到数理统计、数据挖掘论坛逛逛吧
维度高可以先做降维
降维可以用特征选择,也可以用特征提取
willsons7
2012-03-15 11:11:10 +08:00
降维,可以看看random projection相关的东西。
但是貌似感觉你说的数据直接用CLUTO就可以聚类,如果是稀疏的就更好做了。
ElloRay
2012-03-15 11:20:02 +08:00
k-means做太复杂了吧
ElloRay
2012-03-15 11:21:38 +08:00
跟一楼想的一样。。先做好特征提取吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/29090

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX