问一个如何在 Hadoop 中正确引入 IK 资源包的基础问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

This topic created in 3536 days ago, the information mentioned may be changed or developed.

情况是这样的，由于用 PHP 做那 2000w 文字的词频提取耗时太长了，就 Google 了一下，发现 Hadoop 可以做词频分析，就在虚拟机上部署好了 Hadoop ，基本的 WordCount 跑通，然后就想着更改一下，使用 IK 来分词，下载了 IKAnalyzer2012_u6 资源包，把 IKAnalyzer2012_u6.jar 先后放在 /usr/local/hadoop-2.7.3/example 目录下、/usr/local/hadoop-2.7.3/bin 目录下、/usr/local/hadoop-2.7.3/lib 目录下，/usr/lib/jvm/java-8-openjdk-amd64/lib 目录下，结果，当我执行 ./bin/hadoop com.sun.tools.javac.Main ./example/ChineseWordCount.java 的时候，怎么来都给我下面这样的错误：
./example/ChineseWordCount.java:7: error: package org.wltea.analyzer.core does not exist
import org.wltea.analyzer.core.IKSegmenter;
^
./example/ChineseWordCount.java:8: error: package org.wltea.analyzer.core does not exist
import org.wltea.analyzer.core.Lexeme;
^
请 v2er 们指教一下。。

1 replies • 2016-09-02 18:29:52 +08:00

apoclast

Sep 2, 2016

在虚拟机上跑 hadoop...还不如直接本机跑