关于 V2EX 新的自动打标签功能

2014-01-14 10:12:11 +08:00
 Livid
现在在 V2EX 每个主题的右下角,多了一个新的自动打标签功能,及相关的聚合页面。

这是基于 jieba 做的。目前的效果在某些主题上还是不太理想,接下来会继续优化。

大家如果有什么好的思路,或者好的词典,还请多多赐教,谢谢。
13317 次点击
所在节点    Project Babel
71 条回复
SkyTodInfi
2014-01-14 11:55:49 +08:00
@livid 可以考虑有一个特定的标签库,毕竟tf-idf算出来的词比较杂乱,甚至一些是没有意义的

或者选定一些topic,包含一些特定的词语,文本只用jieba分词,打标签使用文本和topic之间的向量空间模型.
wwqgtxx
2014-01-14 12:04:39 +08:00
移动平台呢?
cbsw
2014-01-14 12:29:36 +08:00
需要对一些特殊情况专门处理吧,比如 http://www.v2ex.com/t/96764#reply12 这里内容几乎就是代码, tag 分析出来的只有 print,outer,local 这些没啥意义的词(PS:V2EX 内部链接是怎么写的来着?)
Sunya
2014-01-14 13:48:11 +08:00
放 点击 收藏 那个 topic_buttons 区域会好点, 这样看起来会更让人觉得跟主题相关.

标签用自定义+分词相结合的会不会更好一点. 有些词未必已经收录了.
xiaop
2014-01-14 13:51:53 +08:00
@SkyTodInfi 赞同
gihnius
2014-01-14 14:02:54 +08:00
觉得对主题内容做 tag 已经没有什么意义,因为可以 google.
而且, 打开 tag 之后你会看到很多看过的内容.

最好能对用户做 tag, 当然也是基于用户的内容, 这样其它用户可以根据某个用户的 tag 决定是否关注这个用户的内容.
mozii
2014-01-14 14:06:36 +08:00
@Livid dorentus 赞设计师的直觉。补充个理由:需要变迁基本会是在看完这篇帖子之后,所以出现在末尾是恰当的,标签相当于对该帖子的延伸、补充、互动(这岂不就是回复的实质?),从此点来看,放在回复的这个卡片里,在人们需要的时候进入视野,是好的设计。
mozii
2014-01-14 14:25:52 +08:00
变迁 == 标签
ipconfiger
2014-01-14 15:11:30 +08:00
@Livid
--------------------------
一个副作用就是,由于初始化过程比较慢,每次我们部署完新代码之后,你可能会看到大概 5 秒的 Bad Gateway 500。
--------------------------
这个应该是可以避免的吧
runninghack
2014-01-14 15:15:45 +08:00
可以分享一下词库和停词表吗?
rwx
2014-01-14 15:20:53 +08:00
类似首页的「最热节点」一样,放在屏幕的右侧,比如用户数据的下面,做成标签云
还能防止某个主题标签过多把样式撑破
sobigfish
2014-01-14 15:24:48 +08:00
会提供关注某些tag的功能么?
/tag/iOS
isaced
2014-01-14 15:31:38 +08:00
赞同27楼的换个位置~
xdata
2014-01-14 16:24:41 +08:00
标签能显示与该标签相关联的标签,按数量或拼写排序,并多重过滤么?
mimzy
2014-01-14 16:43:35 +08:00
没有回复的主题标签样式不太一样:


mopig
2014-01-14 17:24:53 +08:00
分词有硬伤啊~

xiaojay
2014-01-14 17:38:08 +08:00
期待根据tag来block
sobigfish
2014-01-14 17:38:45 +08:00
http://www.v2ex.com/tag/Mavericks

@Livid tag里面的帖子排序有点奇怪
Seita
2014-01-14 17:46:06 +08:00
tag 页 不分页?
xiaoyustudio
2014-01-14 19:43:06 +08:00
传完图发现跟 27 楼想到一块去了...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/96918

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX