Lambda plus: 云上大数据解决方案( 七 )_：Lambdaplus:云上大数据解决方案本文

Blink是阿里云在Apache Flink基础上深度改进的实时计算平台，Blink旨在将流处理和批处理统一，实现了全新的 Flink SQL 技术栈，在功能上，Blink支持现在标准 SQL 几乎所有的语法和语义，在性能上，Blink也比社区Flink更加强大。

在TableStore + blink的云上Lambda架构中，用户可以同时使用表格存储作为master dataset和batch&stream view，批处理引擎直读表格存储产生batch view，同时流计算引擎通过Tunnel Service流式处理实时数据，持续生成stream view。

图5 Tablestore + Blink的Lambda plus大数据架构

如上图5，其具体组件分解：

Lambda batch层：Tablestore直接作为master dataset，支持用户直读，配合Tablestore多元索引，用户的线上服务直读、ad-hoc查询master dataset并将结果返回给用户；blink批处理任务向Tablestore下推SQL的查询条件，直读Tablestore master dataset，计算batch view，并将batch view重新写回Tablestore；Streaming层:blink流处理任务通过表格存储TunnelService API直读master dataset中的实时数据，持续产生stream view；Kappa架构的backfill任务，可以通过建立全量类型数据通道，流式消费master dataset的存量数据，从新计算；Serving层：为存储batch view和stream view的Tablestore结果表建立全局二级索引和多元索引，业务可以低延迟、ad-hoc方式查询；