机器学习:CatBoost简介( 七 )

  • Friday cloudy = (15+14) /2 = 15.5

  • Saturdaycloudy = (15+14+20)/3 = 16.3

  • Tuesday cloudy = 0/0 ?

为了克服这个问题 , 我们都知道拉普拉斯平滑在朴素贝叶斯中是做什么的 。 CatBoost实现了相同的功能 。

下面是另一个简洁的例子 ,

在上面的数据集中 , 我们有两个类别(SDE和PR)的特征 , 假设所有数据点都是按时间顺序排列的 。 对于第i个数据点 , 我们将SDE表示为过去以SDE为特征的数据点的类标签的平均值(在分子和分母上添加一些常数以克服0/0错误) 。

分类特征组合

CatBoost结合了多种分类特征 。 在大多数情况下 , 组合两个分类特征是有意义的 。 CatBoost会自动为您完成这一任务 。

推荐阅读