V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
alex321
V2EX  ›  Java

问一个如何在 Hadoop 中正确引入 IK 资源包的基础问题

  •  
  •   alex321 ·
    alexroyce315 · Sep 2, 2016 · 2166 views
    This topic created in 3536 days ago, the information mentioned may be changed or developed.
    情况是这样的,由于用 PHP 做那 2000w 文字的词频提取耗时太长了,就 Google 了一下,发现 Hadoop 可以做词频分析,就在虚拟机上部署好了 Hadoop ,基本的 WordCount 跑通,然后就想着更改一下,使用 IK 来分词,下载了 IKAnalyzer2012_u6 资源包,把 IKAnalyzer2012_u6.jar 先后放在 /usr/local/hadoop-2.7.3/example 目录下、/usr/local/hadoop-2.7.3/bin 目录下、/usr/local/hadoop-2.7.3/lib 目录下,/usr/lib/jvm/java-8-openjdk-amd64/lib 目录下,结果,当我执行 ./bin/hadoop com.sun.tools.javac.Main ./example/ChineseWordCount.java 的时候,怎么来都给我下面这样的错误:
    ./example/ChineseWordCount.java:7: error: package org.wltea.analyzer.core does not exist
    import org.wltea.analyzer.core.IKSegmenter;
    ^
    ./example/ChineseWordCount.java:8: error: package org.wltea.analyzer.core does not exist
    import org.wltea.analyzer.core.Lexeme;
    ^
    请 v2er 们指教一下。。
    1 replies    2016-09-02 18:29:52 +08:00
    apoclast
        1
    apoclast  
       Sep 2, 2016
    在虚拟机上跑 hadoop...还不如直接本机跑
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5441 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 07:08 · PVG 15:08 · LAX 00:08 · JFK 03:08
    ♥ Do have faith in what you're doing.