jianwen
2013-01-27 21:48:49 +08:00
《Hadoop in Action》看了以后能比较快地用起来,我推荐这本书。需要留意的是,书中用的是0.20以前的 Java API,现在的稳定版已经是1.0.x了。我个人觉得问题不大:只是框框变了(新API更简洁一些 ),里面填的东西基本没变。如果使用脚本语言(如Python),调用 Streaming API 的话,这种影响还会更小。
《Hadoop: The Definitive Guide》2nd Edition 我感觉作者是把每个人都当专家了,书一开始就对Hadoop系统本身做了比较详细的分析,但我接受不了。特别是第4章 Hadoop I/O ,非常突兀,内容没有吸引力——一开始总想先尝试MapReduce的威力,对文件系统的操作实在提不起劲。
这两本书都有电子版,可以阅读后再决定购买哪一本。
Manning 2012年又出了一本书《Hadoop in Practice》,是例子集,应该可以用作《Hadoop in Action》的补充。