1.定义
MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的
数据分析应用”的核心框架。
MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。
2.优缺点
优点:
(1)MapReduce易于编程
(2)良好的扩展性
(3)高容错性
(4)适合PB级别以上海量数据的离线处理
缺点:
(1)不擅长实时计算
(2)不擅长流式计算(MapReduce的输入数据集是静态的)
3.MapReduc