机器学习:CatBoost简介( 八 )
在此数据集中 , 有两个特征(国家和头发长度) 。 我们可以很容易地发现 , 只要一个人来自印度 , 他/她的头发颜色就是黑色 。 我们可以将这两个特征表示为一个特征 。 在现实世界中 , 有许多分类特征可以表示为单个特征 。
CatBoost通过构建基本树来实现特征组合 , 其中根节点仅包含单个特征 , 对于子节点 , 它随机选择另一个最佳特征并沿着根节点中的特征表示它 。
下面是CatBoost的图表 , 它将两个特征表示为树的第2级的单个特征 。
catboost中的对称树结构
在树的第一层 , 我们有一个单一的特征 。 当树的层数增加时 , 分类特征组合的数量成比例地增加 。
CatBoost中的one-hot编码
默认情况下 , 当且仅当分类特征具有两个不同的类时 , CatBoost内部用one-hot编码表示所有分类特征 。
-
如果希望对具有N个不同类别的分类特征实现One-hot编码 , 则可以更改参数one_hot_max_size = N 。
推荐阅读
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- 国服|LOLM:60天内如何从小白打到国服王者?这快捷径方法值得学习
- 催眠学习|《催眠学习》PC版,一款教你如何恋爱的游戏,非绅骑步呦!
- 虎牙|哈利波特手游:同流派该如何击败?虎牙小若沐展示细节,值得学习
- 梦幻西游|梦幻西游:一只须弥画魂的励志蜕变史,这才是值得学习人生态度!
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保
- 超级机器人大战30|公开讨薪这事 电竞圈也开始了
- 外挂|《超级机器人大战30》里可以挂机获取资源吗?我来教你一招