机器学习:CatBoost简介(12)

  • 与其他算法一样 , 我们也可以使用class_weight参数来 平衡 不平衡数据集 。

  • CatBoost不仅提供了重要的特征 。 它也告诉了我们 , 对于给定的数据点 , 重要的特征是什么 。

  • 用于训练的代码CatBoost只是简单地直接转发 , 它几乎与sklearn模块类似 。

  • 再见超级参数调整?

    CatBoost由强大的理论实现 , 如有序Boosting , Random permutations 。 它确保我们不会过度拟合我们的模型 。 它还实现了对称树 , 它消除了像(min_child_leafs)这样的参数 。 我们可以进一步调整参数 , 例如learning_rate , random_strength , L2_regulariser , 但结果变化不大 。

    结束

    CatBoost速度极快 , 它的性能优于所有梯度增强算法 。 如果数据集中的大多数特征都是分类的 , 那么它是一个很好的选择 。

    推荐阅读