前言
本书内容全面,对Hadoop整个技术体系进行了全面的讲解,不仅包括HDFS和MupReduce这两大核心内容,而且还包括Hive. Hbase、Mahout、Pig. ZooKeper, Avro、 Chukwa 等与Hadoop相关的子项目的内容。实战性强,为各个知识点精心设计了大量经典的小案例,易于理解,可操作性强。
全书一共18章:
第1章全面介绍了Hadoop的概念。优势、项目结构,体系结构,以及它与分布式计算的关系
第2章详细讲解了Hadoop集群的安装和配置,以及常用的日志分析技巧
第3章分析了Hadoop在Yahoo!、 eBay. Facebook和百度的应用案例,以及Hadop平台上海量数据的排序
第4~ 7章深入地讲解了MapReduce计算模型、MapReduce 应用的开发方法、MapReduce 的工作机制,同时还列出了多个MapReduce的应用案例,涉及单词计数、数据去重、排序、单表关联和多表关联等内容
第8~ 11章全面地阐述了Hadoop的1/0操作、HDFS的原理与基本操作,以及Hadoop的各种管理操作,如集群的维护等
第12 ~ 17章详细而系统地讲解了Hive. Hbase. Mahout, Pig. ZooKeeper. AvrO.Chukwa等所有与Hadoop相关的子项目的原理及使用,以及这些子项目与Hadoop的整合使用:第18章以实例的方式讲解了常用Hadoop插件的使用和Hadoop插件的开发。
由于文档内容过多,所以只截取了目录部分,每个知识点都有更细化的内容。
需要获取这份实战文档的朋友可以转发一下文章并关注我,后台私信【资料】即可免费获取
