同时在线|思考:数据分析与数据后台设计( 四 )


因为分析数据的目标在于找到解决方法,所以分析数据时对于数据的要求比观察数据更高,根据分析数据的行为,要求更为直接:

  1. 足够的数据指标作为基础用于分析;
  2. 足量的数据(时间粒度、时间长度)作为依据;
  3. 使用一定的科学方法得出合理结论。
足够的指标以及足量的数据是为了保证在使用分析方法时有足够的内容得出客观的结论,否则在缺少支持的情况得出的结论依然值得质疑。
分析这个环节考验的是分析者对于数据的掌握程度、对于问题的明确程度以及对于分析方法的了解程度。很多时候不必过于偏重于方法的账号,对于日常中的很多问题,对问题的理解到位加上对于数据的高度理解加上简单的方法也可以得出有效的结论。
分析方法建立在对于统计学、概率统计等数据科学的基础上,不在结合问题与目标的基础上盲目追求掌握方法,并不会对数据分析有太好的帮助。缺乏监控和观察的过程,直接拿到数据也未必能有合理的判断,因为缺少长时间观察监控数据造成对数据的理解,很容易被先入为主的想法影响从发现问题变成验证先入为主的想法。分析的过程已经脱离了数据后台,此时需要靠扎实的态度与数据科学知识帮助自己。
结合分析这部分,我仅以我个人的经验总结了几条数据分析与数据后台的想法:
  1. 通过多种监控来观察数据,通过观察数据得出分析思路,通过分析得出结论;
  2. 看数据的不同行为,提升效率的方式不同,需要后台提供不同的功能来满足;
  3. 后台更多的是为监控和观察提高效率,分析依赖于数据分析者本身的主观行为、能力。
最后还想分享的是,多学、多讨论,数据分析这件事通过讨论交流得来的知识与信息,往往比掌握一个看似高端而不常用的分析方法来的实在。
分析的关键在于让我知道,该做什么。
第二大部分谈谈数据后台的设计思路。
在了解了数据分析的过程以及各过程的目标、关键至后,针对不同过程,数据后台在功能的支持上也有针对性与特殊性。
同时在线|思考:数据分析与数据后台设计
文章插图
在监控数据与观察数据过程中,后台可以通过图、表格高效的展示数据,帮助分析者在看数据时思考获取信息,而分析数据则需要分析者脱离后台的限制根据目标问题进行分析,此时便已经脱离后台了。可以说数据后台奠定了分析数据的基石,因为所有思考分析都来源于数据后台的每一个指标、每一张图以及每一个表格,分析过程依赖于分析者而非后台。
如今的数据类产品已经发展成为监控观察以后台为主,分析思考以工具为主的模式。数据后台提供的是原材料,而像PowerBI、FineBI以及tableau这样的商业智能工具成为了分析数据的利器。数据后台更多在于满足监控与观察,而对于分析过程而言便捷的提供数据获取功能即可,之后的事情则需要交给具有强大分析功能的各类工具。
那么还是从监控数据开始。
在前文举例说明监控数据的要求时,游戏的同时在线人数与阿里云SLB监控两个例子突出了可视化图、细时间粒度的特点,但这只是针对了范围很小的一些数据指标。
以一个电商类产品为例,我需要实时了解交易金额、交易笔数、同时在线人数等指标时,就需要一个更为综合的监控界面帮助分析者快速了解情况,此时在后台的设计上则不能简单的根据需求用可视化图的方式罗列指标展示,因为不同指标在监控对比时时间粒度上不一样。比如同时在线人数可以精细到分钟粒度,而交易金额则可以到小时粒度。

推荐阅读