1.定义:
如下这样的矩阵就是混合矩阵
2.作用:
通过这样的可视化图形来看预测值和真实值的关系,可以直接看出召回率(查全率),和交叉表的作用类似
3.代码
#绘制真实值和预测值对比情况
def plot_confusion_matrix(cm, classes,
title='Confusion matrix',
cmap=plt.cm.Blues):
"""
This function prints and plots the confusion matrix.
"""
plt.imshow(cm, interpolation='nearest', cmap=cmap)
plt.title(title)
plt.colorbar()
tick_marks = np.arange(len(classes))
plt.xticks(tick_marks, classes, rotation=0)
plt.yticks(tick_marks, classes)
threshold = cm.max() / 2.
for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
plt.text(j, i, cm[i, j],
horizontalalignment="center",
color="white" if cm[i, j] > threshold else "black")#若对应格子上面的数量不超过阈值则,上面的字体为白色,为了方便查看
plt.tight_layout()
plt.ylabel('True label')
plt.xlabel('Predicted label')
以上代码可直接使用
4.参数说明
cm:
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test,y_) # y_test 为训练样本已知的目标值, y_ 为训练样本预测值,返回一个ndarray数据
cm
classes: 分类,如[0, 1], 就是将样本预测,预测是0类还是1类
5.调用举例
plot_confusion_matrix(cm,[0,1],title='Recall:%0.3f'%(cm[1,1]/(cm[1,0] + cm[1,1])))
其中cm为 Recall------“正确被检索的正样本item(TP)"占所有"应该检索到的item(TP+FN)"的比例