文本情感分析指数分析接口使用体验,一起完善

2018-05-16 11:56:36 +08:00
 quu

前段时间发了我们的 NLP 体验争议很多,对于发现的问题我们逐一做了改善。

本接口应用场景,建议用于:舆情、情报获取,这种标准的新闻内容筛查方面使用,中文很复杂,换了一个语境就是另外一个事情,所以想要用机器去完全解决中文情感分析,几乎是不可能的,至少短时间都做不到。

所以无需使用,口语语、网络语、谐音错别字、叠加正负面字来刻意找问题,换其它任何一个做这方面内容的引擎,大家都会处于相同的境遇。

工具的存在,是为了让我们更快、更高效、更好的去解决问题,而不是完全替代人类,目前这个阶段,就是流程有标准化可以建立机器规则的,让机器来完成(很多人就把这个逻辑叫了人工智能???),人去解决其它非标的问题。

分享出来,提供给懂得如何用、对这方面有需求的小伙伴,然后大家一起解决问题来完善吧。

昨天临时让团队小伙伴加班写了个超级单薄的接口平台,把接口放了上来,1000 次 /天 对于自用应该够了,商业使用更大的量的话,我们再详谈。

测试 demo: http://txtai.com/product/nlp.shtml

接口申请: http://www.txtai.com/api/api/nlp.shtml

3228 次点击
所在节点    云计算
12 条回复
enenaaa
2018-05-16 12:45:46 +08:00
这类功能拼的是谁语料多吧。楼主语料是多大量级。
data2world
2018-05-16 13:44:02 +08:00
这种完全没需求,除非有价格优势,我刚才测了一下,错误率挺感人的 [虽然是短文本,或是短句子] 。百度 NLP 貌似现在免费? [之前是 10w 次 /天]
回复不能添加图片?
data2world
2018-05-16 13:47:14 +08:00
开放源码吗? [哭笑]
capo
2018-05-16 13:48:59 +08:00
“跌是不可能的”为负面,
百度 QPS 小于 5 免费了
l00t
2018-05-16 13:53:45 +08:00
太弱了,这个分析是基于单独的词吗?貌似不考虑词之间的关系的。
noNOno
2018-05-16 13:56:15 +08:00
@capo 只能偶尔涨一下,才能维持得了生活,这样子
guana
2018-05-16 14:00:53 +08:00
你们 sentiment analysis 的 positive 和 negative 是怎么做的?是基于 lexicon 做的吗?
guana
2018-05-16 14:02:16 +08:00
@enenaaa #1 测试了一个我平常的处理的文本,大连理工的 dutir 的库感觉出来的结果比楼主这个好,斯坦福 nlp 的没测试
asdf123101
2018-05-16 14:08:28 +08:00
手机端验证码有点难用,按上去整个页面都在动。css 是不是有点问题?
data2world
2018-05-16 14:11:57 +08:00
@guana 对啊,百度 NLP 情感分析也比楼主的强太多。不知道楼主是用什么做的??传统的 NB 算法+情感词典?还是最近常用的 Attention 机制+神经网络。关键是,楼主的语料肯定没百度大?。另外,这种通用的,还是别重复造轮子了。如果企业要用的话肯定会定制开发的。
zynlp
2018-05-16 16:32:47 +08:00
楼主最后想走商用?路还很远…
xjtushilei
2018-05-17 09:53:44 +08:00
商用走远了。自己玩玩还可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/455239

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX