朴素贝叶斯:帮助AI产品经理“小步快跑,快速迭代”( 三 )

如下图所示,虽然概念比较多但是都比较容易理解,下面我们逐个详细介绍。

朴素贝叶斯:帮助AI产品经理“小步快跑,快速迭代”

特征条件独立假设是贝叶斯分类的基础,意思是假定该样本中每个特征与其他特征之间都不相关。

例如在预测信用卡客户逾期的例子中,我们会通过客户的月收入、信用卡额度、房车情况等不同方面的特征综合判断。两件看似不相关的事情实际上可能存在内在联系,就像蝴蝶效应一样。普遍情况下,银行批给收入较高的客户的信用卡额度也比较高。

同时收入高也代表这个客户更有能力购买房产,所以这些特征之间存在一定的依赖关系,某些特征是由其他特征决定的。

然而在朴素贝叶斯算法中,我们会忽略这种特征之间的内在关系,直接认为客户的月收入、房产与信用卡额度之间没有任何关系,三者是各自独立的特征。

接下来我们重点讲解什么是“理论概率”与“条件概率”,以及“先验概率”与“后验概率”之间的区别。

推荐阅读