阿里云|寻找DevOps新思路,云上效能还有哪些突破口?( 二 )



阿里云|寻找DevOps新思路,云上效能还有哪些突破口?
文章图片

白皮书的价值在于能够帮助企业更好的定位自身技术状态 , 从而选择合适的路径与产品 , 提升使用云的能力 , 实现降本增效 , 实现最佳实践 。
据悉 , 阿里云内部早已规划了诸多的产品与开发工具 , 而在今年内部按照客户价值与客户需求对相关技术重新进行定位 , 并结合云上CloudOps趋势重新规划 , 将全套运维套件与理念升级为CloudOps 。
标尺出现 , 五大维度衡量CloudOps成熟度
在成熟度模型中 , 阿里云将智能化定义为CloudOps的最终的形态、最高等级;其次则是标准化 。 这与五大衡量维度中的自动化能力息息相关 。
田涛涛认为 , 自动化能力实际上就是当前Everything asCode的趋势所追求的 。 代码化将通往标准化、自动化 , 最终才有可能智能化 。 云的OpenAPI与之完美匹配 。 田涛涛将当前常见的云自动化可以分为三类:

  • Infrastructure as Code:基础设施即代码的理念 , 希望通过构建可编程的基础设施 , 来实现资源的高效自动化配置 。
  • Pipeline as Code: 通过脚本和引擎让原本独立运行于单个或者多个节点的任务连接起来 , 实现单个任务难以完成的复杂发布流程 。
  • Policy as Code: 通过自动化代码来管理权限管控或者安全策略 。
弹性能力是云计算带来的巨大技术红利 , 弹性能力意味着企业可以在秒级、分钟级快速响应资源创建或者释放 , 提升整体的交付速度 , 和资源利用率 。
可靠性能力是云计算的天然优势之一 , 通过大规模数据中心、多数据中心技术 , 实现数据中心同城灾备 , 通过对硬件层的虚拟化 , 其能够来降低和规避物理硬件故障对客户的影响 。 云平台也会提供大量的自助服务来提升可观测性 。
安全合规能力是云的招牌 , 也是云需要守护的底线 。 但是云端操作的高频性有大量自动化任务 , 操作来源和对象相对复杂 , 对操作审计和操作来源和报警的时效性要求较高;同时云端服务命令存在暴露在公网的风险 , 需要安全和网络规划能力;高频的可编程自动化运维需要有审计和问题追踪能力 , 避免越权和不容易被追踪的问题 。
成本管理自然也不必多说 , 云服务相比IDC的最大特点之一是使用资源而非持有资产 , 为用户提供了大量新型的资源规划和付费模式 。

阿里云|寻找DevOps新思路,云上效能还有哪些突破口?
文章图片

自动化能力(Automation)、弹性(Elasticity)、可靠性(Reliabilty)、安全(Security)和成本管理(Cost)——阿里云将这套CloudOps成熟度模型 , 形象地称为CARES模型 。 云上自动化运维需要在五个方面不断优化与打磨 , 才能逐步靠近AIOps的终极目标 。

推荐阅读