寻找替代品是因为我发现, NLTK 这货源码写得非常之烂,重复代码非常多,有些功能写是写了,但根本没接到用户能调用的 API 上,更不要说一堆传了就根本没用到过的参数。。。文档还奇乱无比。。。
所以,有什么替代品推荐呢?希望能符合以下之一:
大而全,从 Tokenizer/CorpusReader ,到各种 Bracket/Tree 结构定义,从 Parser 到 SentimentAnalyzer ,各个方面都有覆盖到,并且 API 的正交性比较好,能快速用 API 组合出所需要的功能。
小而精,专注一其中某一方面,并且做得比较完美的库。
欢迎同步知乎回答: https://www.zhihu.com/question/51766732
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.