第66集 python机器学习:信息泄露示例说明
text":"
信息泄露往往会导致我们对于数据的预测产生一个过于乐观的结果 , 从而导致我们对数据的误判 。
下面我们距离说明信息泄露的情况:我们假象的回归任务 , 包含从高斯分布中独立采样的100个样本与10000特征 , 下面我们以此为例:
from sklearn.linear_model import Ridge
rnd = np.random.RandomState(seed=0)
x = rnd.normal(size=(100 20000))
y = rnd.normal(size=(100))
#我们创建数据集的方式是采用随机得到的100-20000的数据 , 此时x和y之间是没有任何关系的(都是随机
#获取的)
#所以应该不可能从这个数据集中学到任何内容 , 那么 ,
#现在我们利用SelectPercentile特种中选择从20000个特征
#中选择信息量最大的特征
推荐阅读
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保
- 超级机器人大战30|公开讨薪这事 电竞圈也开始了
- 外挂|《超级机器人大战30》里可以挂机获取资源吗?我来教你一招
- 超级机器人大战30|索尼又有大动作!这些新游让PS5变得更香?
- 超级机器人大战30|热血传奇:“麻痹戒指”设定太超前,玩家爆出后整夜不敢下线
- 自动化|《机器人殖民地(Autonauts)》是一款由Denki制作
- 嘉南传|《嘉南传》盗用剑网三同人图,玩家却维权变整活:机器人真好玩