大家觉得目前关于 Hadoop 的书最好的一本是?

2013-01-27 05:17:27 +08:00
 Livid
9498 次点击
所在节点    Hadoop
10 条回复
pieces
2013-01-27 09:36:58 +08:00
hadoop in action不错
forest520
2013-01-27 10:05:45 +08:00
当然是hadoop definitive guide
dreampuf
2013-01-27 12:47:13 +08:00
Hadoop Operations
xuwenhao
2013-01-27 21:21:02 +08:00
Nathan Marz的<Big Data>
jianwen
2013-01-27 21:48:49 +08:00
《Hadoop in Action》看了以后能比较快地用起来,我推荐这本书。需要留意的是,书中用的是0.20以前的 Java API,现在的稳定版已经是1.0.x了。我个人觉得问题不大:只是框框变了(新API更简洁一些 ),里面填的东西基本没变。如果使用脚本语言(如Python),调用 Streaming API 的话,这种影响还会更小。

《Hadoop: The Definitive Guide》2nd Edition 我感觉作者是把每个人都当专家了,书一开始就对Hadoop系统本身做了比较详细的分析,但我接受不了。特别是第4章 Hadoop I/O ,非常突兀,内容没有吸引力——一开始总想先尝试MapReduce的威力,对文件系统的操作实在提不起劲。

这两本书都有电子版,可以阅读后再决定购买哪一本。

Manning 2012年又出了一本书《Hadoop in Practice》,是例子集,应该可以用作《Hadoop in Action》的补充。
rayiion
2013-01-27 21:58:47 +08:00
Hadoop in Action是本不错的大纲类的书,不过工作时还是主要基于官方的几个文档。翻书确实很麻烦啊。
Nourl
2013-01-27 23:51:20 +08:00
- 如果只是把Hadoop当做工具,或者是Hadoop集群维护、从配置角度优化Hadoop,看《Hadoop in Action》吧;
- 如果是要从代码角度improve Hadoop的性能,了解内部实现过程,《Hadoop权威指南》是最好的书籍;
fire9
2013-01-28 12:12:51 +08:00
把市面上有的hadoop书籍都收集齐了,需要的时候就翻翻看看。更好的资料还是在网上啊。
clowwindy
2013-01-28 13:42:50 +08:00
Pro Hadoop 可以入个门。想搞懂原理得看代码。想知道参数怎样调优只能靠实践经验。
viss
2013-01-29 09:03:00 +08:00
<<Hadoop权威指南>>我也这样推荐。我现在在看这本书。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/58916

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX