敝司最近升级了分词与词性标注 API ,准确率有一定提升,调用的 rate 应该也可以满足日常需要了。诸位可以在 bosonnlp.com 注册帐号获取调用 token 感受,这里也有一个可以直接尝试的呆萌。各种参数和调用方式请见API 文档。 gl&hf
分词在很多网站平台, APP 的开发中都是不可或缺的组件,但网上常见的分词项目,对新词与切分歧义的处理差强人意,甚至缺乏一个统一的词语切分标准。在过去的一年时间里,我们玻森在与很多开发团队的沟通中,不断看到这样的情况上演:
开发者由于项目进度周期等限制,对于分词需求,常常直接在网上搜索到一个可能已经停止维护的分词系统,进行简单测试后,快速集成上线。项目初期一切都看上去良好,但随着数据增多、使用的深入,越来越多的问题不断暴露出来。如集成在网站搜索中,随着项目开展需要手动添加越来越多的特殊判定规则以修复由分词所产生的各种 bad case ,最终使得项目变得愈发臃肿与维护困难。
为开发者提供高质量的分析引擎,这是我们 BosonNLP 语义开发平台成立的初衷。自然语言处理( NLP )是一个专业领域,玻森已经有多年的积累。我们希望自己在 NLP 上花费足够多的时间,从而作为开发者的您不需要在上面花费太多时间。希望您能更多集中在产品和创意,或得闲出门走走,看看这个挺大的世界。
本次分词与词性标注引擎是 BosonNLP 过去一年最大的升级:
features:
希望能对您有所帮助~
BosonNLP 团队
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.