一份矛盾重重的报告,如何彰显搜狗的焦虑?( 三 )

此时,影响统计结果的,就是样本是如何选择得来的、如何计算,以及样本是否匹配统计区间的问题。

1、样本是如何抽样和计算来的?

CTR报告在其首页最下方标注了调研以中国互联网信息中心发布的我国网民结构为样本配额设置,这是明显的单一来源随机抽取的做法,且没有写明计算模型:

一份矛盾重重的报告,如何彰显搜狗的焦虑?

而艾媒报告则在首页称数据来自艾媒资讯商业情报数据库、北极星互联网产品分析系统、草莓派数据调查与计算系统(Strawberry Pie)等多个来源,在计算模型上采用了市场调查、行业深度访谈、桌面研究等方法,并使用了艾媒资讯旗下各大数据计算系统和相关计算模型:

一份矛盾重重的报告,如何彰显搜狗的焦虑?

而赛诺报告自称为“简析”,所以这方面并未有任何提及。

统计学中有个很简单的道理,样本量低的时候,增加样本量就是增加准确度;而到样本量增加到一定程度,样本的选择方式、计算模型对结果准确度的影响越来越大,直至成为决定因素。

推荐阅读