DTCC 2019 | 阿里云TSDB: 教你解锁时序时空数据库的种种黑科技(13)

聚合引擎

时序索引的下个模块就是聚合引擎 , 时序索引将查询条件所命中的时间线集合获取之后交给聚合索引 。 而聚合索引就是按照传统关系型数据库的执行器的火山模型模型进行设计的 , 我们为其设计了很多的聚合算子和插值算子 , 这些算子都是以Pipeline方式进行一轮轮迭代的 。 目前 , 一共实现了10多个核心聚合算子 , 20多个填充策略以及10多个插值算法 , 并且这些算子的数量还在不断地增加中 。

借助聚合引擎 , 可以减少内存开销以及对于底层存储的查询压力 , 这是因为有了算子的支持之后 , 只需要每次抓取少批量数据进行计算即可 。 此外 , 聚合引擎和预聚合、降采样也进行了无缝对接 , 当数据写入的时候已经实施了采样过程 , 在实际查询的时候就可以很容易地实现采样 , 聚合引擎就不会从存储层捞取原始数据 , 而是直接捞取预降采样数据 , 从而进行进一步的数据计算 , 这就减少了底层存储的IO操作 。

四、未来与展望

最后为大家介绍一下 , 阿里云数据库技术团队目前在时序时空领域所做的工作和尝试 。

推荐阅读