数据|干货 | 如何避免输出没用的数据分析结果

数据|干货 | 如何避免输出没用的数据分析结果
文章图片

CDA数据分析师 出品
作者:宋天龙
编辑:Mika
大家好 , 我是触脉咨询的合伙人宋天龙 。 今天给大家分享的主题是关于如何避免输出没用的数据分析结果 。
我们先通过例子来简单看一下 , 在日常的数据分析工作中 , 所需要步骤和过程的分析结果的基本情况 。
这个分析结果有用吗?
层次一
先来看第一个 , 是比较初级的数据分析师经常会输出的结果 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

跟2020年相比 , 非媒体新用户的占比稍有提升 , 但留存率有下降 。
这个结论其实是基于数据得到的 。 非媒体指的是非通过费用的方式投放得到的 , 也就是一些正常的合作渠道 。 通过比较可以发现 , 2021年的值有所提升 。 留存率方面 , 指的是21年的9.3%比20年的13.5%有所下降 。
这个结论相当于在现有图表的基础上 , 用文字把结论念了一遍 。 这是初级分析师比较容易输出的结果 。 但是可以发现 , 他只是把数据结果用文字的形式重复了一遍而已 , 其实是没有结论的 。
层次二
下面看第二个层次的 。 在上面结论基础上 , 有的分析师会有一些带有结论的定义输出 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

基于上面留存率和新用户占比的变化 , 可能给出结论 , “这是正常现象” 。 “正常现象”本身就是对于前面所有数据描述的概括 , 这是一个结论 。
后面又分析了从用户成分上 , 2021年的渠道为什么会导致新用户占比的提升 。 可能投放就以拉新为主 , 因此新用户占比提升是正常现象 。 同样的 , 新用户的比例提升就会导致留存率的下降 , 拉低了整个网站的留存率情况 。
这里把在刚才第一句的基础上增加结论句——这是正常现象 。 然后下面增加了分析过程 。 分析过程里涵盖了:新用户的占比为什么提升 , 老用户的整体留存率为什么下降 , 并有分析的过程 。 这比刚才整个的结论显然要好很多了 。 但是仍然不够 。
层次三
下面再看第三个 。 在刚才的基础上 , 又有了进一步的结论 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

结论是 , 但是新用户的比例提升26% , 留存率下降31% 。 按照过去6年的新用户成分与留存率的关系计算 , 留存率下降的比例过高 。
新用户的比例提升26% , 这里是基于28.9% , 减去23.4%的值 , 再比上23.4%得到的 。 同样的也可以计算出新用户留存率下降31%的结果 。
通过这个结论 , 基本上已经发现了一个问题 。 刚才得出“这是正常现象”的结论 , 只是对于新用户的提升跟整个留存率下降的解释 。
但是一增一减的过程中 , 按照过去整个长期数据规律的测算 , 这其实是不符合规律的 。 这是在之前的分析里没有提到的点 。 这个是一个问题 , 新用户的比例上升 , 对于整个的留存率下降来讲是不成比例 。 在这里发现了问题 , 但是仅有这个结果仍然是不够的 。
层次四
再往下看 。 下面又增加了一个分析的部分 , 发现其中B渠道的新用户的数量比较大的 , 同时其新用户的占比可能比较高 。 但是留存率比较差 , 可能会严重的低于整个2011年新用户的留存率 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

整个新用户的比例跟整个留存率下降是不成比例的 。 这是什么导致的?在这里面发现了问题的根源性渠道 , 就是B渠道导致的 。 B渠道新用户的量比较大 , 同时占比较高 , 留存效果较差 。 这里同时考虑了量的因素和各个比例的因素 , 两个因素同时作用下导致了问题出现 。
这里已经发现B渠道是有问题的 , 但只有这样仍然不够 。 我们继续往下看 。
层次五
再经过分析发现 , B渠道的投放策略有问题 。 这是由渠道营销和运营的这些人决定的战略行为 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

通过站内行为分析一下B渠道投放的用户 , 当中用户的转化预期和转化路径等方面是否符合期望 , 这是一个特别重要的分析部分 。
在留存过程中是不是存在某些漏斗环节比较严重 , 也就是说假如留存的周期较长 , 当中需要分几个步骤共同去实现 , 是否有某个步骤问题较大 , 就会导致整个留存过程中出现短板 。
最后我们就会得到落脚点 , 建议针对上面这些问题我们该怎么做 。 最后这一步才是真正的分析问题 , 解决问题 , 提出建议的过程 。
综合一下看看刚才五个层次的过程 。 依次经过了先描述了数据事实 , 去年跟今天的对比 , 之后形成结论 , 这是个正常现象 , 然后做了基本的分析 。
同时在结论基础上发现了问题 , 通过问题继续往下去探究其成因 。 以及最重要的就是有落地 , 发现问题之后 , 建议通过几个方面去做改善和提高 。 这个过程才是有用的分析结果输出 。
大部分的分析师其实是比较初级的 , 只是把数据摆出来 。 稍微进一步的分析师会把数据结论进行简单总结 , 做简单分析 , 这是大部分的初中级分析师现在做的基本程度 。 再往下的中高级分析师 , 会发现一些潜在的问题 , 找到成因 , 最重要的就是最后会输出一些落地的建议 , 而这个落地的建议才是评估它是否有用的标准 。
因此数据分析师的输出 , 无论是PPT、Excel、邮件等形式的数据分析报告 。 这是不够的 , 只是存在于业务员脑子里 。 要能真正有能够落地的建议才是有用的 。
错误的KPI驱动:一开始就错了
下面来讲一讲 , 会导致数据分析结果没有用的一些主要影响因素 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

第一个因素是错误的KPI驱动一开始就错了 。 第一步如果错了 , 后面每个步骤都会出错 。
常见的错误KPI:

  • Display广告过度追求转化率
  • 拉新以“新用户占比”为KPI指标
  • 追求利润阶段 , 选择销售额作为KPI指标
  • 库存商品的销售KPI为利润率
右边截图是海底捞在2021年11月底发布的公告 。 里面提到了一点 , 在之前运营过程中 , 由于经营不善导致了很多店面亏损 , 所以决定要收缩店面做精细化的运营 。 里面反思的一条是 , 过度相信连住利益的KPI指标以及企业文化建设不足 。 大家可以看到 ,KPI定义的不准确会导致整个运营过程中步步都有问题 。
如果方向错了 , 执行再对也是错的 。 因此方向是最重要的开始 。
使用相关性指标来改善KPI:单纯的相关可能导致偏离预期
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

现在在大数据时代 , 可能很多人会强调相关性而非因果关系 。 这种思想会对的实际工作造成严重的数据应用误导 。
如果天很热 , 会导致冰棒和汽水的销量比较高 , 这是一个常识 。 同时天很热的话也会带动比基尼销量的增加 , 因为夏天很多人会去游泳 , 去海边去度假 , 因此比基尼的销量也会提升 。
天很热会导致冰棒和汽水销量增加 , 这是由客观的外部环境决定的 。 天很热也会导致比基尼销量增加 。 这个过程中单纯分开看这两个因果关系都没有问题 , 但如果基于这三个一起去做分析的话 , 就会这样的结论 。
冰棒、汽水的销量和比基尼的销量会成高度的正相关关系 。 如果基于相关性的指标去做KPI改善的话 , 从而得出结论 , 提高冰棒、汽水的销量 , 就能提升比基尼的销量 。 这就是错误的 。
常见的错误相关性应用有:
  • 利用增加访问深度来提升订单转化率
  • 利用增加网站停留时间来提升订单转化率
  • 利用增加老用户占比来提升销售额
使用相关因素来代替因果因素 , 没有抓住核心因素
通常企业在做完营销活动后 , 会进行复盘 。 如果这次活动比较好的话 , 到底是为什么会导致这次运营结果比较好呢?
很多分析师如果没有经验的话可能会这么分析 。 比如把所有能拿到的维度都统一的细分对比分析一遍 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

因此会输出图中左侧的结论 。
把所有现在拿到的数据维度 , 从各个角度上做统计分析和对比 。 这么做没有错 , 但是没有本质上解答问题 。
如果是有经验的分析师会怎么做呢?他会着重分析运营相关的因素 , 从而找到里边的经验 。
这里以用户运营为例 ,CRM推送里老用户的销售额贡献占了79% 。 接着重点去分析用户运营里做了什么或者做对了什么 。
  • 人群选的对
通过预测模型得出 , 人群比较精准 , 因此选对人是一个重要的因素 。
  • 商品选的对
通过推送时 , 商品跟用户购买商品的匹配度会比较高 , 因此商品选的对 , 也是一个特别重要的因素 。
  • 推送时机、推送渠道、标题策略……
从而通过这样的分析 , 告诉用户运营部门 , 当中做了什么样的事情 , 做对了什么 , 哪些地方可能没做对 , 因此之后需要把对的继续保持 , 错的要做修改和优化去提升 。 这是能够直接从因果关系的层面去分析到底这个活动结果为什么好 。
没有画龙点睛之笔 , 没有业务的落脚点 。
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

这里面没有业务落脚点就包含两个场景 , 第一个就是没有落地建议 , 你只给了他的这种结论分析过程 , 甚至好多这种模型算法解释 , 但是分析完之后就没有结果落地建议 。 第二类就是没法落地的建议 , 给出一些比较难落地的建议 。
因此 , 我们建议分析师一定要去了解业务 , 业务方的整个运营流程是怎么样的 , 以及评估之后 , 业务方到底有哪些事情可以做 , 以及它的范围内可以做 。 这些都是你在落地里面需要去考虑的因素 , 而并不是说基于数据去单纯的做分析和建议 , 你需要把业务的背景知识和业务的权力范围 , 以及业务的需求点放到你的建议里面去 。
单因素的因果逻辑 , 因为差所以要改善
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

举个例子 , 这是网站的真实客户的情况 。 从用户到站 , 最终要让用户完成抽奖的过程 , 但是抽奖前给设置了几个中间环节 , 比如到站之后 , 需要关注 , 留下电话号码 , 最后再来抽奖 。 如果说按这个流程的话 , 其实只需要一步行了 , 用户达成之后直接进行抽奖 , 不要中间这个过程 , 一定会发现抽奖率是非常高的 , 它就会高于现在四个步骤 。
抽浆转化率会有一定的流失 , 但是我们获得了大量的关注 , 留下电话号码的用户的粉丝和销售线索 。 这个时候其实它是一个平衡的状态 , 我拿流失的抽奖转化率的用户 , 换来的是粉丝和销售线索的增加 。
大多数业务场景下 , 我们不能只居于一个因素去做考量 , 因为那是太幼稚的一个想法了 。
讲自己不懂的故事 , 我们不会比运营方“更懂”业务
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

分析师的重点或者核心竞争力 , 不是在于多么懂业务 , 而是懂得如何通过数据去驱动业务 , 实现更好的数据化运营 , 这个是数据分析师的价值所在 。
在输出结果的时 , 避免给班门弄斧 , 除非有数据的支撑 。 数据分析师不应该讲如何运营 , 而是讲如何通过数据更好的实现运营 。
超出报告服务对象的执行范畴:无意义的越俎代庖
数据|干货 | 如何避免输出没用的数据分析结果
文章图片

为谁写报告 , 就应该以报告对象的服务为核心 。
举个例子 , 以社交媒体部门为例 , 要给他写一个报告 , 这个时候给的建议点比较合理的会包括哪些?
合理的建议点:
  • 如何发掘KOL和KOC
  • 如何提前发掘热点话题
  • 如何监控并找到负面评价
  • 如何找到并利用裂变路径
这些都是合理的建议 。
下面再看一些哪些是超出范畴的建议 , 比如:
  • 如何改善网站内部流程
  • 如何优化SEO
  • 如何改进搜索功能
  • 如何设置商品策略
所以事实上是你给谁服务就要给他去做专门的数据的报告 。 所以这里面其实我建议大家就是要把权、责、利统一起来 , 这是有效落地的基础出发点 。
【数据|干货 | 如何避免输出没用的数据分析结果】以上就是我今天的分享内容了 , 希望对大家能够有所帮助 。

    推荐阅读