我要这金牌有何用:Kaggle 竞赛成绩真能“保送”谷歌、FB 吗?( 五 )

首先我觉得这个取决于你参加比赛的类型。

在我(有限)的 Kaggle 经历中,我发现那些获奖者很少拥有最佳模型。如果模型要通过准确性得分/ AUC 进行评估,可以说前 10 名团队的得分都会大于 99.5%。你知道,这些模型大部分都被遗忘了。

所以我觉得赢得 Kaggle 比赛不一定会让你成为优秀的 ML 从业者。不错,接近完美的准确性是很好,但如果暴露在真实数据中时完全瘫痪,那就不是一个成功的模型。

网友「Nitro_V」也赞同这一观点,同时补充了自己的观点:

而且,通常在一些数据竞赛的最终排名中,前几名之间的区别只是算力的区别,有时甚至前 20 名之间的分数差距都不是特别明显。我见过在一些竞赛上,排名榜单从头到尾使用的模型都几乎相同。我个人认为,使用可行的,耗费算力更小的模型,要比一个过拟合的巨型网络要好得多。」

跟帖的网友「omniron」说:

以我有限的经验看来,赢得 Kaggle 比赛最重要的问题在于赛会设置的评估标准——而它们并非总是有意义的。我们必须选择一些标准来评估每个人的水平,而这个标准并不总是适合他们要解决的实际任务。

推荐阅读