dreampuf
2012-10-09 01:31:54 +08:00
一般recommender system有几个评价指标。这些指标都是有user log(训练集)来验证。
召回度,RS 返回的item数/符合条件的item总数
精确度,和user log 匹配程度
覆盖率,RS给出的推荐item出现次数加权求和,一般用作为对长尾内容的挖掘
多样性,推荐的item之间差异程度
新颖性,一般而言相对热门item而言,也就是将推荐的item的热门程度计入权重
惊喜度,比较新颖度而言,惊喜item一般为反user log的推荐,或者看似没有遵照user log的推荐,前提是这个推荐是用户喜欢的(定义喜欢?发生点击,持续发生动作。。。)
信任度,推荐item和你之前行为的联系(Amazon的“由于您购买了XXX所以给您推荐YYY“,weibo中的“你们之间有XX个共同好友“),其实就是推荐系统的推荐行为自我解释。
还有实时性,健壮性。。。。建立这些标准都是为了在多个推荐系统实现中评定算法好坏。
通过上面的一些评判指标,应该可以解决你的疑问。
国内已经有很不错的推荐系统应用(淘宝,百分点。。。。),但是推荐系统只是整个系统生态的外围设施,对于传统的指标:内容,用户,产品,体验。。比较来说,推荐至多算作锦上添花。