Hadoop深度运维:Apache集群原地升级Ambari-HDP( 五 )

Hadoop深度运维:Apache集群原地升级Ambari-HDP

(点击图片可查看清晰大图)

下图是整个集群的操作流程:

Hadoop深度运维:Apache集群原地升级Ambari-HDP

(点击图片可查看清晰大图)

二、各组件升级的技术本质和挑战

升级顺序是:

Zookeeper → HDFS → Yarn → HBase

升级的通用思想是:备份老集群的元数据目录,用HDP版本的进程,使用新备份出来的元数据目录启动。如果遇到任何错误,可以迅速回滚(使用Apache版本的进程,使用老的元数据目录重启)。

备份元数据的好处是,新HDP进程启动过程中发生任何问题,不会污染老的元数据。

每个组件在升级过程中,都有一些特殊的难点,分别阐述:

推荐阅读