如何更好地挖掘数据价值?( 四 )

3.3 数据准备

数据准备通常占用项目时间的大约90% 。 数据准备阶段的结果是最终数据集 。 一旦识别出可用的数据源 , 就需要选择、清理、构造 , 并将其格式化为所需的形式 。 在此阶段可以进行更深入的数据探索任务 , 这个需要数据分析师基于业务的理解来选择是否进行下一步的探索 。

3.4 建立模型

首先 , 选择合适的建模技术用于准备好的数据集 。

接下来 , 生成测试数据集以验证模型的准确度 。

然后 , 在准备好的数据集上创建一个或多个模型 。

最后 , 需要对涉及利益相关的模型进行仔细评估 , 以确保所创建的模型符合业务计划 。

3.5 模型评估

在评估阶段 , 必须在第一阶段的业务目标背景下评估模型结果 。 在此阶段 , 如果在模型结果中发现的新模式或其他因素 , 可能会提出新的业务需求 。 获得业务理解是数据挖掘中的一个迭代过程 。 必须在此步骤中决定是否继续进入制作报告阶段 。

推荐阅读