第57集 python机器学习:混淆矩阵( 四 )

[ 47   0

Dummy model:

[[361  42

[ 40   7

Decision tree:

[[390  13

[ 24  23

logistic regression

[[401   2

[  8  39

观察混淆矩阵 , 很明显可以看出pred_most_frequent有问题 , 因为它总是预测同一个类别 , 其他值为0 。 其次是pred_dumy , 真正正例很少(7个) , 假正例个数比真正例还多 。

决策树的预测比虚拟预测更有意义 , 假正例和真正例大体相同;当然 , 效果最好的还是Logistic回归了 , 不管是真正例还是真反例都具有明显的优势 , 说明预测效果好 。

推荐阅读