如何掌握数据科学界的“黑色黄金”?( 六 )

但是 , 这仍然是一个固定的数据集 , 具有固定数量的样本、固定模式 , 以及正样本和负样本之间的固定级别的分离(如果我们假设它是一个分类问题) 。

你是否从以下方面学习了算法的所有复杂性:

· 样本复杂度

· 计算效率

· 处理级别不平衡的能力

· 面对不同程度的类分离、度量的健壮性

· 作为数据复杂度的函数的偏倚-方差权衡

可能没有 。 没有一个数据集能够为给定的机器学习算法提供所有这些深刻的见解 。 但是 , 这些是你能够成为一个真正的机器学习专家实践者需要掌握的非常重要的见解 。

所以 , 你将会需要一个非常丰富并足够大的数据集 , 这个数据集对于所有的这些实验来说都是足够的 。

你能做什么?

推荐阅读