第69集 python机器学习:网格搜索预处理及其模型选择

第69集 python机器学习:网格搜索预处理及其模型选择


"multi_version":false

我们可以利用管道将机器学习工作流程中所有处理步骤封装成一个scikit-learn估计器 , 这么做的好处在于 , 我们可以使用监督任务(比如回归或分类)的输出来调节预处理参数 。

管道包含3个步骤——缩放数据、计算多项式和岭回归

from sklearn.datasets import load_boston

from sklearn.preprocessing import PolynomialFeatures

boston = load_boston()

x_train x_test y_train y_test = train_test_split(boston.data boston.target random_state=0)

pipe = make_pipeline(StandardScaler() PolynomialFeatures() Ridge())

#我们一般可以利用管道搜索degree参数以及Ridge的alpha参数来判断是否要选择多项式或交互项

推荐阅读