BAT大牛教你:怎样透彻的掌握一门机器学习算法( 四 )

花时间仔细挑选你问题中的组成元素以便为你的问题给出最佳解答 。

4. 进行试验并且报告你的结论

完成你的实验 , 如果算法是随机的 , 你需要多次重复实验操作并且记录一个平均数和标准偏差;如果你试图寻找在不同实验(比如带有不同的参数)之间结果的差异 , 你可能想要使用一种统计工具来标明差异是否统计上显著的(就像学生的t检验) , 一些工具像R和scikit-learn/SciPy完成这些类型的实验 , 但是你需要把它们组合在一起 , 并且为实验写脚本 。 其他工具像Weka带有图形用户界面 , 你所使用的工具不要影响问题和你实验设计的严密 , 总结你的实验结论 。 你可能想使用图表 。 单独呈现结果是不够的 , 他们只是数字 。 你必须将数字和问题联系起来 , 并且通过你的实验设计提取出它们的意义

对实验问题来说 , 实验结果又暗示着什么呢?

保持怀疑的态度 。 你的结论上有留什么样的漏洞和局限呢 。 不要逃避这一部分 。 知道局限性和知道实验结果一样重要 。

5. 重复

推荐阅读