華為云計算云知識【云小課】EI第27課模型調(diào)優(yōu)利器-ModelArts模型評估診斷

【云小課】EI第27課模型調(diào)優(yōu)利器-ModelArts模型評估診斷

時間: 2021-07-06 15:57:56

AI開發(fā)平臺

猜你想看：

實時語音識別云服務器配置 CDN是什么意思視頻點播加速什么是云桌面

在訓練模型后，用戶往往需要通過測試數(shù)據(jù)集來評估新模型的泛化能力。通過驗證測試數(shù)據(jù)集上的平均損失，可以評估模型對未知數(shù)據(jù)的預測能力。模型評價指標是評估模型泛化能力的標準，不同的指標往往會導致不同的評判結(jié)果。

ModelArts模型評估/診斷功能針對不同類型模型的評估任務，提供相應的評估指標。在展示評估結(jié)果的同時，會根據(jù)不同的數(shù)據(jù)特征對模型進行詳細的評估，獲得每個數(shù)據(jù)特征對評估指標的敏感度，并給出優(yōu)化建議。模型評估/診斷功能幫助用戶可以全面了解模型對不同數(shù)據(jù)特征的適應性，使得模型調(diào)優(yōu)可以做到有的放矢。

當前模型評估功能覆蓋圖像分類、物體檢測和圖像語義分割三大場景，快來看看如何使用模型評估功能吧~

圖像分類

圖像分類評估指標說明

指標名稱	子參數(shù)	說明
精度評估	圖像類別分布	不同類別圖片數(shù)量的統(tǒng)計值。
	混淆矩陣	混淆矩陣可幫助您了解分類錯誤的出現(xiàn)位置
	召回率	召回率，正確預測的正例數(shù)和實際正例總數(shù)的比值，這個值越大代表漏檢的概率越小。計算公式R=TP/(TP+FN)，即混淆矩陣中某一列預測正確的個數(shù)除以該列的樣本和。
	精確率	精確率，正確預測的正例數(shù)和預測正例總數(shù)的比值，這個值越大代表誤檢的概率越小。計算公式P=TP/(TP+FP)，即混淆矩陣中某一行預測正確的個數(shù)除以該行的樣本和。
	F1值	精確率與召回率的調(diào)和均值。計算公式F1=2PR/(P+R)，其中R為召回率，P為精確率。
	ROC 曲線	ROC 曲線用于繪制采用不同分類閾值時的 TPR （真正例率，縱坐標）與 FPR（假正例率，橫坐標），ROC曲線越接近左上角，該分類器的性能越好。
敏感度分析	不同特征范圍下的準確率	將圖片根據(jù)特征值，如亮度、模糊度等劃分為幾個部分，分別測試幾個部分的精度然后繪圖。
	特征分布	圖片特征值的分布圖。
	值敏感度	展示不同類別數(shù)據(jù)在不同特征值范圍內(nèi)的F1值，用于判別模型對哪個特征范圍內(nèi)的圖片效果較好。

物體檢測

物體檢測評估指標說明

指標名稱	子參數(shù)	說明
精度評估	圖像類別分布	數(shù)據(jù)集中不同類別的圖像框個數(shù)統(tǒng)計。
	P-R曲線	根據(jù)每種分類的置信度對樣例進行排序，逐個把樣例加入正例進行預測，算出此時的精準率和召回率。使用這一系列的精準率和召回率繪制的曲線，即是一個類別的P-R曲線。
	不同目標框交并比閾值下的mAP	計算不同目標框交并比閾值下的mAP值，并繪制曲線，反饋mAP值最高的閾值。其中交并比閾值是用于NMS時過濾可能預測為同一物體的重疊框的閾值。
	不同置信度閾值下的F1值	計算不同置信度閾值下的平均F1值，并繪制曲線，反饋F1值最高的閾值。
	誤檢分析	從預測結(jié)果角度統(tǒng)計錯誤檢測的結(jié)果，包含準確檢測、類別誤檢、背景誤檢、位置偏差四種誤檢的錯誤類型，繪制成餅圖，統(tǒng)計各類錯誤占錯誤檢測的比例。從預測結(jié)果的角度出發(fā)，預測框與實際框的交并比大于0.5時，預測框與實際框類別不符，認為是類別誤檢；預測框與實際框的交并比大于0.1小于0.5，預測框與實際類別相符，認為是位置誤檢；預測框與實際框的交并比小于0.1，認為是背景誤檢。
	漏檢分析	從實際標簽角度統(tǒng)計遺漏檢測的結(jié)果，包含準確檢測、類別誤檢、背景誤檢、位置偏差四種漏檢的結(jié)果類型，繪制成餅圖，統(tǒng)計各類錯誤占漏檢錯誤的比例。從實際框的角度出發(fā)，實際框與預測框交并比大于0.5，實際框與預測框類別不符，認為是類別漏檢；實際框與預測框的交并比大于0.1小于0.5，實際框與預測框類別相符，認為是位置漏檢；實際框與所有預測類別相同的框交并比小于0.1，認為是背景漏檢。
敏感度分析	不同特征范圍下的準確率	與圖像分類相似，但可選更多和目標框相關的特征，如目標框的交疊程度，目標框的個數(shù)。
敏感度分析	特征分布	與圖像分類相似，但可選更多和目標框相關的特征，如目標框的交疊程度，目標框的個數(shù)。

圖像語義分割

圖像語義分割評估指標說明

指標名稱	子參數(shù)	說明
精度評估	圖像類別分布	數(shù)據(jù)集中不同類別的像素個數(shù)統(tǒng)計。
	交并比	簡稱IoU，計算每一類預測結(jié)果與標簽的交并比，表達了預測集合與標簽集合的交并比，對各類別的值求平均獲得的就是平均交并比。交并比計算公式如下所示。假設類別總數(shù)是k+1 類，pii 表示第i類分類正確的數(shù)量，pij 表示第i類被識別為第j類的數(shù)量。
	Dice系數(shù)	取值范圍為0-1，越接近1說明模型越好。Dice系數(shù)計算公式如下所示。假設類別總數(shù)是k+1 類，pii 表示第i類分類正確的數(shù)量，pij 表示第i類被識別為第j類的數(shù)量。

調(diào)用模型評估接口了解評估結(jié)果

ModelArts提供了“analyse”接口，用于模型評估。用戶在推理結(jié)束后，傳入指定參數(shù)調(diào)用該接口即可獲取評估結(jié)果。

analyse(task_type='',pred_list=[]，label_list=[],name_list=[],custom_metric='',label_map_dict='')

上一篇：復制備份還原點CopyCheckpoint 下一篇：刪除函數(shù)異步配置信息DeleteFunctionAsyncInvokeConfig

五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

圖像分類

物體檢測

圖像語義分割

調(diào)用模型評估接口了解評估結(jié)果

最新文章