DTCC 2019 | 阿里云TSDB: 教你解锁时序时空数据库的种种黑科技(11)
如下图所示的是真实场景下的数据压缩效果 。 原始情况下数据大约6TB , 一开始尝试最普通的块压缩 , 将数据压缩到了715G , 但此时的数据压缩比不到10:1 , 而采用先进行时序压缩再追加一次块压缩后使得最终数据压缩为413G , 压缩比达到了15:1 。 那么 , 追求如此之高的数据压缩比有什么好处呢?其实主要有两个好处 , 第一个好处就是能够帮助用户降低存储成本;另外一个好处就是因为数据压缩比很大 , 因此当在进行大范围的时序数据查询的时候 , IO效率会非常高 , 在这个例子中可以将查询延时降低约50% 。
时序索引
TSDB的整体查询流程非常简单 , 当用户指定了一个查询条件 , 阿里云TSDB首先会解析这个查询条件 , 同时做一定程度的优化 。 接下来会做两件事情 , 一件是将查询条件扔给时序索引模块 , 时序索引模块会根据查询条件计算命中的时间线数量以及相关信息 , 拿到时间线信息之后再将时间线集合扔给聚合索引 , 聚合索引再到底层存储上面获取相应的时间数据并进行降采样、聚合等操作 。 虽然这一过程看上去比较简单 , 但是却存在很多值得研究的点 。
推荐阅读
- 2019英雄联盟全球总决赛|S9的Tian对比S11的Tian,今非昔比,心态炸裂
- 剑网3|剑网3:2019年大型818被铲出,女主简直无底线!
- 2019英雄联盟全球总决赛|三国志战略版S9赛季4套新阵容,3大登庸令新队伍搭配!
- ag战队|AG杀疯了!初晨的露娜永远值得相信,一诺信心回来了,梦回2019
- estar|AG超玩会要小心eStar,阿泰表示,花海梦回2019年,有可能是AG夺冠最大的障碍
- 乌迪尔|LOL:本周3款半价,这款2019年的皮肤,首次在周半价中出现
- 阿里巴巴|阿里巴巴最新业绩来了!营收大增30%,这一数据超3500亿...
- 三星Galaxy|阿里云盘上架App Store,高达10MB/s下载速度
- 阿里巴巴|当年马云将0.2%股份,给了阿里前台小妹,20年后她的现状如何?
- 阿里巴巴|被马云“赶出”阿里的王牌,今市值270亿,却飞向了马化腾的怀抱