第66集 python机器学习:信息泄露示例说明( 二 )
from sklearn.feature_selection import SelectPercentile f_regression
select = SelectPercentile(score_func=f_regression percentile=5).fit(x y)
x_selected = select.transform(x)
print(\"x_selected shape :{\".format(x_selected.shape))
print(\"cross validation accuracy of Ridge: {:.3F\".format(np.mean(cross_val_score(Ridge()
x_selected y cv=5))))
运行结果为:
cross validation accuracy of Ridge: 0.935
从运行结果来看 , 随机获取的数据集得到的平均R2居然为0.935 , 显然是不符合实际情况的 , 由于我们在交叉验证之外对特征进行拟合 , 所以他能够找到在训练部分和测试部分相关的特征 。 从测试部分泄露出去的信息包含的信息量非常大 , 导致得到不切实际的结果 。 下面我们通过使用管道来进行预测 , 然后看看对比结果:
推荐阅读
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保
- 超级机器人大战30|公开讨薪这事 电竞圈也开始了
- 外挂|《超级机器人大战30》里可以挂机获取资源吗?我来教你一招
- 超级机器人大战30|索尼又有大动作!这些新游让PS5变得更香?
- 超级机器人大战30|热血传奇:“麻痹戒指”设定太超前,玩家爆出后整夜不敢下线
- 自动化|《机器人殖民地(Autonauts)》是一款由Denki制作
- 嘉南传|《嘉南传》盗用剑网三同人图,玩家却维权变整活:机器人真好玩