机器学习:CatBoost简介( 五 )

已经在第一数据点上训练的模型用于计算第二数据点的残差 。

  • 已经在前两个数据点上训练的另一个模型用于计算第三和第四数据点的残差

  • 等等…

  • 在上面的示例数据集中 , 现在我们使用已经在x1 , x2 , x3和x4上训练的模型计算x5 , x6 , x7和x8的残差 。

    我到目前为止所解释的所有这些程序都被称为有序增强 。

    随机排列

    CatBoost实际上将给定数据集划分为随机排列 , 并对这些随机排列应用有序增强 。 默认情况下 , CatBoost创建四个随机排列 。 有了这种随机性 , 我们可以进一步停止过度拟合我们的模型 。 我们可以通过调整参数bagging_temperature进一步控制这种随机性 。 这是您在其他增强算法中已经看到的内容 。

    处理分类特征