Python 下有哪些大而全或小而精的自然语言处理库? NLTK 的替代品?

2016-10-19 19:08:57 +08:00
 speedcell4

寻找替代品是因为我发现, NLTK 这货源码写得非常之烂,重复代码非常多,有些功能写是写了,但根本没接到用户能调用的 API 上,更不要说一堆传了就根本没用到过的参数。。。文档还奇乱无比。。。

所以,有什么替代品推荐呢?希望能符合以下之一:

大而全,从 Tokenizer/CorpusReader ,到各种 Bracket/Tree 结构定义,从 Parser 到 SentimentAnalyzer ,各个方面都有覆盖到,并且 API 的正交性比较好,能快速用 API 组合出所需要的功能。

小而精,专注一其中某一方面,并且做得比较完美的库。

欢迎同步知乎回答: https://www.zhihu.com/question/51766732

3905 次点击
所在节点    自然语言处理
2 条回复
linkht
2016-10-28 18:38:30 +08:00
如果考虑商用的 推荐
玻森 nlp 或者 腾讯文智
shm7
2019-07-01 19:11:21 +08:00
spacy,hanlp snownlp ?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/313950

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX