《并行与分布式程序设计》课程教学参考书:分布式与云计算(美)Tom White《Hadoop权威指南》(中文第3版)
第9章和第10章主要面向Hadoop管理员,主要描述如何在Hadoop集群上 设置和维护运行HDFS和MapReduce。 第11章~第15章专门介绍在Hadoop上构建的特定项目或相关内容。第11 章和第I2章描述的是Pig和Hive,这两个分析平台构建在HDFS和 MapReduce之上,而第I3章、第14章和第15章分别介绍HBase、 ZooKeeper和Sqoop。 最后,第I6章收集了Apache Hadoop社区成员提供的一系列实例。 第2版新增内容 《Hadoop权威指南》(第2版)新增两章内容(第12章和第15章),分别介绍 Hive和Sqoop。第4章新增一个小节专门介绍Avro,第9章概述Hadoop 新增的安全特性,第I6章新增一个新的实例分析,介绍如何使用Hadoop 来分析海量网络图。 第2版继续介绍Apache Hadoop0.20系列发行版本,因为这是本书写作期 间最新、最稳定的发行版本。本书中有时会提到一些最新发行版本中的一 些新特性,但在首次介绍这些特性时,我会说明具体的Hadoop版本号。 第3版新增内容 第3版概述了Apache Hadoop 1.x(以前的0.20)系列发行版本,以及新近的 0.22和2x(以前的023)系列。除了少部分(文中有说明)例外,本书包含的 所有范例都在这些版本上运行过。第1章的1.6节将进一步描述每一个发行 版本的特性。 第3版的大部分范例代码都使用了新的MapReduce API。因为旧的API仍 然应用很广,所以文中在讨论新的API时我们还会继续讨论它,使用旧 API的对应范例代码可以到本书的配套网站下载。 Hadoop2.0最主要的变化是新增的MapReduce运行时MapReduce2,它建 立在一个新的分布式资源管理系统之上,该系统称为YARN。针对建立在 YARN之上的MapReduce,第3版增加了相关的介绍,第6章介绍它的工 作机制,第9章介绍如何运行它。 第3版还增加了更多对MapReduce的介绍,包括丰富的开发实践,比如用 前言 Xi
<<向上翻页向下翻页>>