第69集 python机器学习:网格搜索预处理及其模型选择( 五 )

我们可以将GridSearchCV和pipeline进一步结合起来 , 也可以搜索管道中正在执行的步骤(比如用StandardScaler还是MinMaxScaler) 。 这样会导致更大的搜索空间 , 所以应该予以考虑——尝试所有可能的解决办法 , 通常并不是一种可行的机器学习策略 。

下面以cancer数据集上搜索使用RandomForestClassifier还是SVC为例:

print(\"Best score of parameters without poly: {:.3f\".format(grid.score(x_test y_test)))

from sklearn.pipeline import Pipeline

pipe = Pipeline([('preprocessing' StandardScaler()) ('classifier' SVC())
)

#我们可以定义搜索的parameter_grid , 希望classifier是RandomForestClassifier或SVC 。

#由于两种分类器需要调节不同的参数 , 并且需要不同的预处理 , 所以我们可以使用“在非网络

#空间的搜索“来搜索网格列表这里我们跳过了过道中的某个步骤(如 , RandomForestClassifier

推荐阅读