小白必看:数据分析5个常见误区!( 四 )

要成为更好的数据科学家 , 只需问一问为什么 。 这个问题有助于消除数据科学家和公司其他部门同事之间的沟通障碍 。

想象一下 , 一家零售公司的营销主管要求建立一个数据模型 , 该模型能够显示有多少消费者产生购买行为的原因是与他们访问网站的渠道相关的 。 在创建模型之前 , 你可以先问问为什么 。 是为了了解哪些客户是最有价值的 , 这样他们就能知道从哪里可以获得更高的转化率?是为了帮助销售团队优先考虑渠道吗?他们有办法衡量新老客户吗?他们会将产品收益作为考虑因素吗?

为了建立一个真正有用的模型 , 你必须理解你的同事希望用它去解决的问题——当你这样做的时候 , 你可能比你最初预想的更容易解决它 , 这对每个人都有好处 。

误区5假设您的数据是干净的

在许多情况下 , 数据科学家80%的工作是清理数据——最后20%的工作是运行机器学习或深度学习模型 , 以获取数据洞察 。

接收数据集时要做的第一步是辨认有多少数据是直接可用的 , 第二步是确定如何让获得一个完全可用的数据集 。

推荐阅读