有没有文本自动分类的 api?

2014-02-12 16:40:10 +08:00
 shinebay
现在项目需要自动进行文本归类,比如输入“大家觉得<环太平洋>这部电影好不好看呀?”,程序判定其分类为:娱乐>>电影,有没有这方面好的api或程序,祝回答的人天天开心
5885 次点击
所在节点    程序员
14 条回复
keller
2014-02-12 17:16:37 +08:00
关系到分词算法和语意分析
具体能够直接应用的API应该还没有
9hills
2014-02-12 17:21:09 +08:00
没有这么高级的API。。
RangerWolf
2014-02-12 17:21:24 +08:00
我只知道有一些api 能自动的检测是不是垃圾评论
比如 wordpress 自带的那个
名字一下不记得了
shikailun
2014-02-12 17:31:01 +08:00
如果分类事先确定的话,贝叶斯分类算法貌似可以实现楼主的需求
y051313
2014-02-12 17:32:45 +08:00
shikailun
2014-02-12 17:40:18 +08:00
朴素贝叶斯在文本分类中的应用 http://yzmduncan.iteye.com/blog/1930695
txlty
2014-02-12 17:44:56 +08:00
这东西应该很值钱的。可以直接用于做垃圾站赚钱。
chlx
2014-02-12 18:00:51 +08:00
@txlty 是么?能具体说说不
cctvsmg
2014-02-12 18:07:45 +08:00
jieba分词,自己做个词库
shinebay
2014-02-12 18:37:34 +08:00
@txlty 真的吗?能具体一点吗?怎样用这个api赚钱啊,谢谢了
YouXia
2014-02-12 18:55:50 +08:00
@shinebay 卖服务就可以啊。大公司养这么多科学家,比如做数据挖掘,文本分类,聚类等等相关的,就是为了解决此或类似的问题啊。小公司没有这么多人力和财力,如果需要用到这种东西,可能会考虑买别人的服务了。
crossmaya
2014-02-12 21:39:34 +08:00
mark一下。
cjjer
2014-02-12 21:57:08 +08:00
@y051313 能透露一下这个的价格么?我用户名@163.com 也可以,非常感谢。
y051313
2014-02-12 21:59:49 +08:00
具体价格我不是很清楚,是global负责的,他们提过一句这个是按照用量来收费的。
我们用到这个CatEngine的是一个多语言数据库,这个程序实现了对全部13种语言文档的自动分类识别。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/99901

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX