如何让数据挖掘过程中的人工标注充满快乐?与爱...

2016-05-14 11:03:01 +08:00
 sundays

毕业小项目, 2W 条语料, 1 、 0 标注。我真的是疯了...

2275 次点击
所在节点    机器学习
8 条回复
laoyur
2016-05-14 11:06:16 +08:00
换挖 1024 的数据
laoyuan
2016-05-14 11:52:48 +08:00
找三篇关于富士康工厂的深度报道看完
sdshiyan2005
2016-05-14 13:48:12 +08:00
觉得最好利用 captcha 或者游戏的思路来做,把人的闲散认知资源利用起来
qqmishi
2016-05-14 14:34:03 +08:00
发给其他人标注,自己就快乐了
sriuu
2016-05-14 15:25:22 +08:00
不可能 找外包吧
h4x3rotab
2016-05-14 16:10:36 +08:00
或者迁移学习
fuyufjh
2016-05-14 23:32:45 +08:00
到各种兼职论坛发帖,每千条数据 20 块
zix
2016-06-13 13:37:34 +08:00
参考人类计算的思路,可以做成游戏,将标注作为游戏目标,让玩家在游戏过程中完成标注任务。当然表现形式必须要好好设计。

当然这样完成一个游戏的工作量不一定比手工标注 2w 条语料来得少哦……

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/278575

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX