人工智能项目的十条建议--概念篇( 二 )



7.注意你的预测和业务进度限制业务目标几乎总是遵循进度表 , 因此请考虑模型的训练和预测允许多少时间和计算能力 。 有些情况需要立即进行预测 , 而其他情况可以在闲暇时分批完成 。 您可能有可用的大型计算集群 , 或者可能必须使用很少的内存快速训练模型 。 训练一个超级复杂的神经网络有可能并不是业务真正想要的
8. 预先了解存在哪些法律限制在金融等受监管的行业中 , 可以使用哪些信息以及模型必须有多透明是有限制的 。 提前知道哪些数据可以自由使用 。 如果您想要的字段受到限制 , 请找出是否可以以某种方式对其进行存储或匿名化 。 同样重要的是 , 哪些机器学习模型可以用于任务 , 而不会影响监管标准 。 例如 , 决策树通常被认为是非常透明的 , 而神经网络则不是 。 为了满足法律要求 , 通常需要轻微的性能下降 。
9. 了解部署方法了解如何部署解决方案可以帮助您简化开发过程 。 需要考虑的几件事是数据格式、模型存储位置、时间和维护 。 这是托管模型吗?是否有您必须遵循标准公司流程?在设计的早期阶段意识到这些将节省大量时间和工作 。
10. 不要重新发明轮子也许 , 最重要的是 , 不要只花时间复制当前的解决方案 。 如果存在解决方案 , 请使用它 。 利用您的时间和计算能力来迭代和改进可用的方案 , 形成通用的工具 , 满足其他不同需求的业务使用
结论所以你理解了这十条建议 , 可以为您的数据科学项目做好准备 。 无论您是在大型公司还是创业公司 , 都不要紧 , 遵循这些核心原则 , 您将永远不会偏离目标 。

推荐阅读