想远离欠拟合OR过拟合?正则化最有效!( 五 )

为了将正则化应用于线性回归 , 我们在成本和梯度函数中引入了一个附加项 。

线性回归的常规成本函数如下所示:

这是平方误差均值的一半 。

为了应用正则化 , 我们引入了一个由参数λ控制的新项:

类似地 , 因为梯度函数是成本函数的偏导数 , 所以这也改变了梯度函数 。 现在是具有正则化的梯度函数:

现在 , 由于梯度函数是用来训练算法到最佳可能θ值的方法 , 我们可以研究新的梯度函数来理解正则化的作用 。

· 对于θ0来讲并没有影响——渐变函数没有偏移 。

· 对于θj来讲 , 这是针对每个特征术语 , 我们引入了λ术语 。 这将有助于抑制数据集中不太有用的功能 。

如你所见 , 新参数λ控制正则化的幅度 。 λ的最佳值因问题而异 。 一些机器学习库将包括为问题和训练集自动找到λ的最佳值的功能 。

推荐阅读