掃二維碼與項目經(jīng)理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流
python如何畫P-R曲線

創(chuàng)新互聯(lián)公司專注于弋江企業(yè)網(wǎng)站建設,成都響應式網(wǎng)站建設公司,購物商城網(wǎng)站建設。弋江網(wǎng)站建設公司,為弋江等地區(qū)提供建站服務。全流程按需定制開發(fā),專業(yè)設計,全程項目跟蹤,創(chuàng)新互聯(lián)公司專業(yè)和態(tài)度為您提供的服務
Python生成P-R圖需要安裝第三方庫matplotlib、numpy及sklearn。
推薦學習《Python教程》。
P-R曲線的生成方法:
根據(jù)學習器的預測結(jié)果對樣本進行排序,排在前面的是學習器認為最可能是正例的樣本,排在最后的是最不可能是正例的樣本,按此順序逐個將樣本作為正例預測,則每次可以計算出當前的查全率、查準率,以查全率為橫軸、查準率為縱軸做圖,得到的查準率-查全率曲線即為P-R曲線。
也就是說對每個樣本預測其為正例的概率,然后將所有樣本按預測的概率進行排序,然后依次將排序后的樣本做為正例進行預測,從而得到每次預測的查全率與查準率。這個依次將樣本做為正例的過程實際上就是逐步降低樣本為正例的概率的域值,通過降低域值,更多的樣本會被預測為正例,從而會提高查全率,相對的查準率可能降低,而隨著后面負樣本的增加,查全率提高緩慢甚至沒有提升,精度降低會更快。
sklearn的計算過程與定義相反是按概率從小到大遞增的順序來計算查準率與查全率的,并且分別為查準率和查全率添加了1和0。
#coding:utf-8
import matplotlib
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import precision_recall_curve
from sklearn.utils.fixes import signature
plt.figure("P-R Curve")
plt.title('Precision/Recall Curve')
plt.xlabel('Recall')
plt.ylabel('Precision')
#y_true為樣本實際的類別,y_scores為樣本為正例的概率
y_true = np.array([1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0])
y_scores = np.array([0.9, 0.75, 0.86, 0.47, 0.55, 0.56, 0.74, 0.62, 0.5, 0.86, 0.8, 0.47, 0.44, 0.67, 0.43, 0.4, 0.52, 0.4, 0.35, 0.1])
precision, recall, thresholds = precision_recall_curve(y_true, y_scores)
#print(precision)
#print(recall)
#print(thresholds)
plt.plot(recall,precision)
plt.show()

我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流