想远离欠拟合OR过拟合?正则化最有效!( 八 )

将λ设置为13 , 我们发现算在概括问题的解决方案方面更加有效 。 但是 , 它在训练集的上限方面表现仍不完美 。 虽然不完美 , 但模型仍然是没有任何正则化的改进 , 这显然只是一个例子 , 在现实生活中我们可能已经使用特征消除和正则化的组合来获得更好的结果 。

这个例子展示了如何应用正则化改善机器学习模型 。 然而 , 找到最佳λ值可能是一个挑战 。 拥有能够可视化的一维或者二维数据使其更容易一些 。 如果没有可视化数据的选项 , 建议使用可靠的测试数据集来计算算法丢失或错误 。 从那里你可以尝试许多不同的λ值来找到具有最低误差的λ值 。 如果选择此方法 , 请记住测试数据集必须与训练数据不同 ——这是你可以测试算法的一般化并避免过度拟合模型的唯一方法 。

推荐阅读