有大大知道delicious 自动实现tag功能,大致实现方式和背后的技术么?

2012-04-07 22:49:50 +08:00
 wening
最近痴迷与研究delicious,向自己做一个,向知道他背后的tag如果自动生成,如何自动提取
有知道的大大麻烦说下,或者给个资料参考也行啊
3761 次点击
所在节点    程序员
9 条回复
sinreal
2012-04-07 23:04:26 +08:00
大概方法:提取首页关键字,根据关键字和训练数据中做匹配。具体实现,这个要问推荐系统,自然语言处理的同学说说,有没有现成的库?
args
2012-04-07 23:08:34 +08:00
我觉的就是把别人对这条链接的tag排序,然后输出最前面几个。
chouj
2012-04-07 23:26:15 +08:00
我在推特上弄了个机器人,自动输出Delicious的“rss”tag条目。发现最近机器人发出来好多“porn”和“adult”内容( http://delicious.com/tag/recent/rss ),于是我发信问Delicious。人回信曰:

"Delicious has no control over the tags users assign to their links, so any time you browse the recent or popular list for all users' tags, there is no way for us to filter the content that are displayed. It seems some on Delicious are saving their adult links for their RSS feed, and are tagging them as such."

也就是说,你搞一堆Delicious马甲收藏某光诚的页面,然后统一打上“锦涛”的tag,就能让“锦涛”这个Delicious tag输出一个光诚的页面。。。

希望对你有帮助。
caomu
2012-04-07 23:34:24 +08:00
这个就是分众分类法啊,delicious之后就流行了,人肉的力量。
然后推荐的时候应该就是推荐排名靠前的……不过这里面应该要有一些干预的算法,像PageRank那样,避免故意的捣乱。
其实我觉得delicious对数据挖掘得不够充分应该还有更好用的书签服务的。。。
wening
2012-04-08 03:06:30 +08:00
@chouj 刚刚被隔壁寝室兄弟拉过去搞dota了,汗啊,悔死我了,这么重要的内容才看到
嗯,多谢啊
有现成的内库么
wening
2012-04-08 03:06:44 +08:00
@sinreal 同求库啊
wening
2012-04-08 03:08:20 +08:00
@caomu 嗯,我也觉得啊,我再想google+1和delicious合起来的话,会是怎么一个情况啊
比如,我对一个网页加一,同时就生出了tag收藏
superisaac
2012-04-08 10:01:55 +08:00
TF.IDF算法啊
chouj
2012-04-08 10:44:17 +08:00
@wening 这个木有

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/31639

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX