Hadoop深度运维：Apache集群原地升级Ambari-HDP( 四 )_：Hadoop深度运维：Apache集群原地升级

第二种是拷贝数据的方式升级，需要额外的服务器资源，需要新搭平台，然后把旧平台的数据拷贝过去，数据拷贝完毕后，再把旧集群的机器下线了慢慢加入到新集群，该方法一般实施周期较长，但风险较小。

根据实际情况（成本/可行性分析）考虑，最后选择方案三：Apache集群原地升级Ambari-HDP。

原地升级该怎么做？主要有以下思考：

第一，升级的重中之重是HDFS，只要HDFS完成托管且数据不丢失，其他组件Yarn、HBase就能水到渠成，这样我们主要精力放到HDFS的升级上面；第二，Apache集群的HDFS版本为2.7.2，HDP的为2.7.3，NameNode元数据的结构是一致的；第三，HDP版本和Apache的解析数据的方式、原理是一样的，只有进程启动的方式、配置文件的目录不一样。所以只要把Apache HDFS的元数据拷贝到HDP的元数据目录，然后用HDP命令启动Name Node就可以升级NameNode；DataNode同理，HDP启动DataNode只要配置中指向老集群的数据目录即可。如此，Apache的HDFS就可升级成HDP版本。

下图是整个集群升级前后的部署全景对比：