基于深度学习的分词系统(pullword)开放 API,永久免费。

2014-07-01 13:13:08 +08:00
 wb13
开发者: @梁斌penny
网站: pullword.com
API链接: api.pullword.com (支持POST/GET以及telnet)

原微博: http://www.weibo.com/1497035431/BbxAQ0TZF
11680 次点击
所在节点    分享发现
7 条回复
ryon
2014-07-01 13:37:07 +08:00
这是之前@livid 说的那个分词解决方案么?
Livid
2014-07-01 13:47:38 +08:00
@ryon 不是。

而且这个 API 目前看起来只能分词,还无法提取关键词列表。
ryon
2014-07-01 13:58:55 +08:00
@Livid 是的,目前功能感觉不够用。期待v2ex所用方案的发布。到时候记得@下,谢谢:)
kisshere
2014-07-01 14:21:17 +08:00
三个问题,1.这个和SCWS有何区别? 2.能提取关键词么,比如"小苹果这首歌是中国的神曲"那么能不能提取小苹果和神曲作为关键词,3.既然api永久免费,为何不开放源码?
wb13
2014-07-01 14:29:03 +08:00
@kisshere 为什么人们都知道 ‘一味索取’ 呢?
fanghui
2014-07-01 17:06:04 +08:00
收藏了,谢谢
zzzvvvxxxd
2015-07-10 09:39:04 +08:00
@kisshere
1. 首先SCWS全称就是Simple Chinese Word Segmentation,而pullword是使用了Bengio的模型改了一些trick,算是深度学习的应用。两者的分词准确度不可比,另外pullword是可以根据反馈优化模型的。完全不是一个层面的产品,从技术含量和价值,pullword是显然胜过前者的。

2. 提取关键词是完全另外的模型算法和学术方向,一个个人作品,而且专注于分词的产品,都每必要实现所谓的关键词。而且短文本抽取关键词,和实体识别(NER)还有热词发现其实区别不大。

3. 免费什么时候等价于开源了
你要注意,这个项目学术价值也很足,加上作者并没有在一开始靠这个骗论文和钱,很难保证其他人不会
而且,也许代码可以开源,里面一些学术和模型可能是不适合开源的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/120406

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX