BAT云计算大数据处理技术应用是什么样?Hadoop大数据处理告诉你( 二 )

本篇共10章 , 涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce 计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与维护、基于MapReduce 的数据挖掘实践及面向未来的大数据处理技术 。 最后附有一个在Windows环境下搭建Hadoop开发及调试环境的参考手册 。

第1章为大数据处理概论 , 对大数据处理给出了一个多维度定义 , 梳理了大数据处理平台的基础架构 , 介绍了完成大数据处理任务要解决的3个关键问题一存储、计算和容错 , 并归纳性地总结了Hadoop技术的关键性思路 。

第2章以Hadoop技术的来源 , Google的三大关键技术为引子 , 介绍了Hadoop整体架构、基本原理和发展历程 , 在此基础上展示了一个使用Hadoop技术完成大数据处理工作的简明框架 , 同时简要介绍了目前Hadoop技术在国内知名企业中的应用情况 。

第3章深入剖析了MapReduce计算模式 , 包括原理和工作机制 , 介绍了实用性的MapReduce应用开发方法 , 并结合简单的实例讲解了几类常用的MapReduce设计模式 , 同时以3个经典算法为例讲解了MapReduce算法的设计精髓 , 最后给出了一些重要的MapReduce程序优化的方法 。

推荐阅读