BAT大牛教你:怎样透彻的掌握一门机器学习算法( 三 )

在随机森林模型中 , 在训练集上增加任意属性对在分类准确性上有什么影响?

针对算法 , 设计你想回答的问题 。 仔细考虑 , 然后列出5个逐渐演变的问题 , 并且深入推敲那个最精确的 。

3.设计实验

从你的问题中挑选出关键元素然后组成你的实验内容 。 例如 , 拿上面的示例问题为例:“二元分类问题中逻辑回归上的不同的参数缩放有什么影响?”

你从这个问题中挑出来用来设计实验的元素是:

属性缩放法:你可以采用像正态化、标准化 , 将某一属性提升至乘方、取对数等方法

逻辑回归:你想使用哪种已经实现的逻辑回归 。

二元分类问题:存在数值属性不同的二分类问题标准 。 需要准备多种问题 , 其中一些问题的规模是相同的(像电离层) , 然而其他一些问题的属性有不同的缩放值(像糖尿病问题) 。

性能: 类似分类准确性的模型性能分数是需要的

推荐阅读