前段时间发了我们的 NLP 体验争议很多,对于发现的问题我们逐一做了改善。
本接口应用场景,建议用于:舆情、情报获取,这种标准的新闻内容筛查方面使用,中文很复杂,换了一个语境就是另外一个事情,所以想要用机器去完全解决中文情感分析,几乎是不可能的,至少短时间都做不到。
所以无需使用,口语语、网络语、谐音错别字、叠加正负面字来刻意找问题,换其它任何一个做这方面内容的引擎,大家都会处于相同的境遇。
工具的存在,是为了让我们更快、更高效、更好的去解决问题,而不是完全替代人类,目前这个阶段,就是流程有标准化可以建立机器规则的,让机器来完成(很多人就把这个逻辑叫了人工智能???),人去解决其它非标的问题。
分享出来,提供给懂得如何用、对这方面有需求的小伙伴,然后大家一起解决问题来完善吧。
昨天临时让团队小伙伴加班写了个超级单薄的接口平台,把接口放了上来,1000 次 /天 对于自用应该够了,商业使用更大的量的话,我们再详谈。
测试 demo: http://txtai.com/product/nlp.shtml
1
enenaaa 2018-05-16 12:45:46 +08:00 via Android
这类功能拼的是谁语料多吧。楼主语料是多大量级。
|
2
data2world 2018-05-16 13:44:02 +08:00
这种完全没需求,除非有价格优势,我刚才测了一下,错误率挺感人的 [虽然是短文本,或是短句子] 。百度 NLP 貌似现在免费? [之前是 10w 次 /天]
回复不能添加图片? |
3
data2world 2018-05-16 13:47:14 +08:00
开放源码吗? [哭笑]
|
4
capo 2018-05-16 13:48:59 +08:00 1
“跌是不可能的”为负面,
百度 QPS 小于 5 免费了 |
5
l00t 2018-05-16 13:53:45 +08:00
太弱了,这个分析是基于单独的词吗?貌似不考虑词之间的关系的。
|
7
guana 2018-05-16 14:00:53 +08:00
你们 sentiment analysis 的 positive 和 negative 是怎么做的?是基于 lexicon 做的吗?
|
8
guana 2018-05-16 14:02:16 +08:00
@enenaaa #1 测试了一个我平常的处理的文本,大连理工的 dutir 的库感觉出来的结果比楼主这个好,斯坦福 nlp 的没测试
|
9
asdf123101 2018-05-16 14:08:28 +08:00 via Android
手机端验证码有点难用,按上去整个页面都在动。css 是不是有点问题?
|
10
data2world 2018-05-16 14:11:57 +08:00
@guana 对啊,百度 NLP 情感分析也比楼主的强太多。不知道楼主是用什么做的??传统的 NB 算法+情感词典?还是最近常用的 Attention 机制+神经网络。关键是,楼主的语料肯定没百度大?。另外,这种通用的,还是别重复造轮子了。如果企业要用的话肯定会定制开发的。
|
11
zynlp 2018-05-16 16:32:47 +08:00 via iPhone
楼主最后想走商用?路还很远…
|
12
xjtushilei 2018-05-17 09:53:44 +08:00
商用走远了。自己玩玩还可以
|