[关闭]
@Macux 2018-01-18T08:54:50.000000Z 字数 2119 阅读 1758

Hadoop性能调优总结

Hadoop



1、MapReduce 性能调优

1.1 前言

Hadoop MapReduce 性能调优的 核心 是让 Hadoop 集群资源均衡,而不是简单地调整几个参数。
PS:Hadoop 的参数一共有180多个,当然不是调整几个那么容易! - -

1.2 Hadoop 性能调优的对象

1.3 具体的调优策略

1.3.0 map慢的常用调参技能

将以下三个参数值调小

  1. mapred.max.split.size
  2. mapred.min.split.size.per.rack
  3. mapred.min.split.size.per.node

Mobvista集群,这三个参数的默认值是1GB。
降低为128MB,即128000000
整个Map的速度会变快。

1.3.1 消除 Map 阶段多余的磁盘溢写

1.3.2 改善 Reduce 执行阶段的网络传输

1.3.3 优化磁盘 I/O 操作

1.3.4 优化 Hadoop 机架感知(rack awareness)

1.3.5 确定最优的 Mapper 数和 Reducers 数

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注