我是单纯做互联网开发的,不懂这方面,想要拓展一下知识面。有没有大佬能用自然语言大概描述一下现在主流使用的用户聚类有的大概过程,让我有个大概概念就行。
我目前能理解的原教旨主义聚类是,收集用户的数据各项数据,比如登录时长,使用时长,给一些典型的有标记的视频点赞之类的这些数据,然后收集了 n 个特征之后,这 n 个特征就是一个 n 维数据。然后我知道机器学习里面有些算法可以给高维数据降维,比如降到三维的话放到空间坐标系里就能比较直观地观察。然后可以使用一些简单的聚类算法,比如我知道二维里面有各种聚类算法(以前看过效果图),可以让空间距离更近的一些点被划分成一类。
不过感觉这套逻辑很原始,似乎并不能应用在目前的互联网网站中。
具体来说,我很好奇两个问题: 1 、我很好奇谷歌分析,能分析出网站用户是男是女,关注什么话题。我比较好奇这是怎么做到的,因为用户没有填写这些信息。 2 、视频网站中看到一个视频后会推荐同类视频,说明视频之间也有一个类的关系,我也挺好奇是怎么实现的。
有没有大佬讲一下,谢谢
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.