前言

本书内容全面，对Hadoop整个技术体系进行了全面的讲解，不仅包括HDFS和MupReduce这两大核心内容，而且还包括Hive. Hbase、Mahout、Pig. ZooKeper, Avro、 Chukwa 等与Hadoop相关的子项目的内容。实战性强，为各个知识点精心设计了大量经典的小案例，易于理解，可操作性强。

全书一共18章:

第1章全面介绍了Hadoop的概念。优势、项目结构，体系结构，以及它与分布式计算的关系

第2章详细讲解了Hadoop集群的安装和配置，以及常用的日志分析技巧

第3章分析了Hadoop在Yahoo!、 eBay. Facebook和百度的应用案例，以及Hadop平台上海量数据的排序

第4~ 7章深入地讲解了MapReduce计算模型、MapReduce 应用的开发方法、MapReduce 的工作机制，同时还列出了多个MapReduce的应用案例，涉及单词计数、数据去重、排序、单表关联和多表关联等内容

第8~ 11章全面地阐述了Hadoop的1/0操作、HDFS的原理与基本操作，以及Hadoop的各种管理操作，如集群的维护等

第12 ~ 17章详细而系统地讲解了Hive. Hbase. Mahout, Pig. ZooKeeper. AvrO.Chukwa等所有与Hadoop相关的子项目的原理及使用，以及这些子项目与Hadoop的整合使用:第18章以实例的方式讲解了常用Hadoop插件的使用和Hadoop插件的开发。

由于文档内容过多，所以只截取了目录部分，每个知识点都有更细化的内容。

需要获取这份实战文档的朋友可以转发一下文章并关注我，后台私信【资料】即可免费获取

hadoop可以做什么项目(京东大数据工程师耗时3年著作这份Hadoop实战文档（PDF）)

前言

相关推荐

相似问题

精选推荐