V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
zbl430
V2EX  ›  Python

stanford 词性标注 性能慢

  •  
  •   zbl430 · 2017-11-29 17:52:59 +08:00 · 1640 次点击
    这是一个创建于 2552 天前的主题,其中的信息可能已经有所发展或是发生改变。

    代码如下

    #! /usr/bin/env python
    # -*- coding: utf-8 -*-
    
    """
     *
    """
    import sys
    import time
    from nltk.tag import StanfordPOSTagger
    
    reload(sys)
    sys.setdefaultencoding('utf-8')
    
    model_filename = "./data/modles/pos.tagger"
    path_to_jar = "./stanford-postagger.jar"
    Tagger = StanfordPOSTagger(model_filename=model_filename, path_to_jar=path_to_jar)
    
    if __name__ == "__main__":
        st = time.time()
        print Tagger.tag([u"你的", u"百度", u"打人"]), time.time()-st
        print Tagger.tag([u"你的", u"百度", u"打人"]), time.time()-st
        print Tagger.tag([u"你的", u"百度", u"打人"]), time.time()-st
    

    输出:

    [(u'\u4f60\u7684', u'nz'), (u'\u767e\u5ea6', u'nz'), (u'\u6253\u4eba', u'v')] 5.10674095154 s
    [(u'\u4f60\u7684', u'nz'), (u'\u767e\u5ea6', u'nz'), (u'\u6253\u4eba', u'v')] 10.2533240318 s
    [(u'\u4f60\u7684', u'nz'), (u'\u767e\u5ea6', u'nz'), (u'\u6253\u4eba', u'v')] 16.8123478889 s
    
    

    速度竟然如此慢,请大佬赐教,是我打开方式不对还是怎么??

    2 条回复    2017-11-29 22:42:16 +08:00
    holajamc
        1
    holajamc  
       2017-11-29 18:33:04 +08:00
    既然已经用了 stanford 不如直接用 hankcs
    knightdf
        2
    knightdf  
       2017-11-29 22:42:16 +08:00
    别用 python 调了,好像每次起一个 jvm 做的,当然慢了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   881 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:04 · PVG 05:04 · LAX 13:04 · JFK 16:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.