眼看下一轮引力波团就要到来 , 巡航舰上的船员陷入了犹豫:这样下去与慢性自杀无异 。 K30舰长也陷入了两难的境地 , 一时间也不知道如何是好 。
此时的星牛反倒没有说话 , 自己躲在角落好像在思考着什么 。 星牛确实想到了什么 。 因为BIT“生前”曾经跟他提到过一个方案 , 就是在遇到陨石雨的时候 , 就是如果我们能够侥幸通过陨石雨 , 但是损失惨重的话 , 可以通过一个增强方案以备下次使用 。 于是星牛把这个方案分享给了大家 。
简单来说 , 我们利用现在掌握的数据很难获得一个精准的模型以准确判断引力波团的冲击力到底有多大 , 但是我们起码有个基础的模型 , 准确率可以达到60%以上 , 如果我们有多个类似的基础模型 , 每个基础模型能够在不同的数据判断上有所侧重 , 然后将多个模型“融合”在一块 , 作为整体的模型 , 利用整合之后的模型继续学习数据的深层次信息 , 或许能够获得一个更好的效果提升 。 而多个效果不甚理想的基础模型是通过反复学习得到的 , 即第一轮我们可以获得一个基础模型 , 他能够在60%多的数据上表现出良好的判断准确性 , 剩下30%多容易误判;接下来改变数据的权值分布或者概率分布 , 从而使得当前这个基础模型误分类的样本(30%多分类错误的样本)权重获得提升 , 正确分类的样本权重下降 , 从而在训练下一轮效果比较差的基础模型的时候 , 可以让模型更加关注误分类的样本(具体就是提升误分类的数据样本的权重 , 对应的也提升了模型需要优化的误差或者损失 , 然后通过优化函数使得模型可以在这些被上一轮模型误分类的数据上重点学习从而判断更准确) , 然后随着学习轮次的增加 , 所有的误分类的样本都会如此通过概率分布的调整被不断训练的新的基础模型所解决 , 最终 , 整合之后的模型对所有数据误分类的情况普遍下降 , 理想情况下甚至可以达到消除误分类 。
最终 , 大家齐心协力成功将巡航舰驶过引力波团 。 然而他们不知道的是 , 等待他们的可能比毁灭还要痛苦… …
02—掉书袋【1】 上述情节中将多个基础模型组合在一块形成集成模型是对AdaBoost算法思想的一个简单介绍 。
【2】 Adaboost是boosting算法的一个例子 , 也叫提升算法 , 最早是以多项式算法的形式被提出 。
【3】算法中会根据基础模型在当前权重分布的样本上的表现 , 比如哪些分类错误 , 错误率是多少等决定下一轮数据的权重 , 这样在不改变数据的情况下通过权重调整了数据分布 , 从而可以调整模型学习的方向 。
【4】Adaboost如何将弱分类器集成为强分类器呢?思路很简单 , 通过加权多数表决的方式 , 具体来说 , 减小分类误差率大的弱分类器的权值 , 使其在分类中起较小的作用;同时加大分类误差率小的弱分类器的权值 , 使其在分类中起较大的作用 。
03—参考文献1. 关键字:《统计学习方法》、李航
2. 关键字:《机器学习》、西瓜书、周志华
3. 关键字:coursera、Adaboost
推荐阅读
- 伽马射线暴,可能决定地球生命的未来,它如何产生及怎样预防
- 额外的维度与强子对撞机中的黑洞
- 黑洞如何“进食”?炙热气体高速旋转坠入,无法逃脱
- 直径1630万光年,天文学家发现最大星系,银河系不如它的零头
- 厉害了!爱因斯坦又一观点得到证实:时空会发生扭曲
- 2000亿颗恒星绕着转动,银河系中心到底是什么,为何如此“亮”?
- 敬畏自然,淡看人生
- 超大质量黑洞的密度竟低于空气?这是怎么回事?
- 在黑洞中为何时间变成了空间,而空间变成了时间?