V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
speedcell4
V2EX  ›  自然语言处理

Python 下有哪些大而全或小而精的自然语言处理库? NLTK 的替代品?

  •  
  •   speedcell4 · 2016-10-19 19:08:57 +08:00 · 3905 次点击
    这是一个创建于 2947 天前的主题,其中的信息可能已经有所发展或是发生改变。

    寻找替代品是因为我发现, NLTK 这货源码写得非常之烂,重复代码非常多,有些功能写是写了,但根本没接到用户能调用的 API 上,更不要说一堆传了就根本没用到过的参数。。。文档还奇乱无比。。。

    所以,有什么替代品推荐呢?希望能符合以下之一:

    大而全,从 Tokenizer/CorpusReader ,到各种 Bracket/Tree 结构定义,从 Parser 到 SentimentAnalyzer ,各个方面都有覆盖到,并且 API 的正交性比较好,能快速用 API 组合出所需要的功能。

    小而精,专注一其中某一方面,并且做得比较完美的库。

    欢迎同步知乎回答: https://www.zhihu.com/question/51766732

    2 条回复    2019-07-01 19:11:21 +08:00
    linkht
        1
    linkht  
       2016-10-28 18:38:30 +08:00 via iPhone
    如果考虑商用的 推荐
    玻森 nlp 或者 腾讯文智
    shm7
        2
    shm7  
       2019-07-01 19:11:21 +08:00 via iPhone
    spacy,hanlp snownlp ?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3574 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 04:40 · PVG 12:40 · LAX 20:40 · JFK 23:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.