對于AI開發(fā)者而言,在開始模型訓(xùn)練前,都得提前準(zhǔn)備大量的數(shù)據(jù),完成數(shù)據(jù)標(biāo)注后,才能用于AI模型構(gòu)建。
一般情況下,模型構(gòu)建對輸入的訓(xùn)練數(shù)據(jù)都是有要求的,比如圖像分類,一類標(biāo)簽的數(shù)據(jù)至少20條,否則您訓(xùn)練所得的模型無法滿足預(yù)期。為了獲得更好的模型,標(biāo)注的數(shù)據(jù)越多,訓(xùn)練所得的模型質(zhì)量更佳。
正因為如此,數(shù)據(jù)標(biāo)注的工作顯得有點繁重枯燥,數(shù)據(jù)多,工作重復(fù)。
ModelArts主打是一個易用、好用的AI平臺,想AI開發(fā)者所想,智能標(biāo)注功能,一鍵解決人工標(biāo)注的煩惱。智能標(biāo)注功能快速完成數(shù)據(jù)標(biāo)注,為您節(jié)省70%以上的標(biāo)注時間。智能標(biāo)注是指基于當(dāng)前標(biāo)注階段的標(biāo)簽及圖片學(xué)習(xí)訓(xùn)練,選中系統(tǒng)中已有的模型進行智能標(biāo)注,快速完成剩余圖片的標(biāo)注操作。
一鍵智能標(biāo)注,怎么用?
- 在ModelArts管理控制臺,選擇“ 數(shù)據(jù)管理 >數(shù)據(jù)集”。
- 創(chuàng)建一個數(shù)據(jù)集,數(shù)據(jù)集類型需選擇“圖像分類”或“物體檢測”類型。
- 單擊數(shù)據(jù)集名稱,進入數(shù)據(jù)集概覽頁。然后,單擊右上角“開始標(biāo)注”,進入數(shù)據(jù)集詳情頁。
- 在數(shù)據(jù)集詳情頁,單擊“待確認”頁簽,然后單擊“啟動智能標(biāo)注”。
- 在彈出的“啟動智能標(biāo)注”對話框中,選擇智能標(biāo)注類型。
智能標(biāo)注有兩種類型:
“主動學(xué)習(xí)”表示系統(tǒng)將自動使用半監(jiān)督學(xué)習(xí),難例篩選等多種手段進行智能標(biāo)注,降低人工標(biāo)注量,幫助用戶找到難例。同時,可選擇“快速型”或“精準(zhǔn)型”的算法類型。“快速型”僅使用已標(biāo)注的樣本進行訓(xùn)練;“精準(zhǔn)型”會額外使用未標(biāo)注的樣本做半監(jiān)督訓(xùn)練,使得模型精度更高。
“預(yù)標(biāo)注”表示選擇用戶模型管理里面的模型,選擇模型時需要注意模型類型和數(shù)據(jù)集的標(biāo)注類型相匹配。從當(dāng)前賬號管理的模型列表中選擇一個匹配的模型,用于智能標(biāo)注。
下圖為“圖像分類”類型的智能標(biāo)注:
下圖為“物體檢測”類型的智能標(biāo)注:
- 單擊“提交”后,啟動智能標(biāo)注。
智能標(biāo)注有哪些限制
- 目前只有“圖像分類”和“物體檢測”類型的數(shù)據(jù)集支持智能標(biāo)注功能。
- 啟動智能標(biāo)注時,需數(shù)據(jù)集存在至少2種標(biāo)簽,且每種標(biāo)簽已標(biāo)注的圖片不少于5張。
- 啟動智能標(biāo)注時,必須存在未標(biāo)注圖片。
- 啟動智能標(biāo)注前,保證當(dāng)前系統(tǒng)中不存在正在進行中的智能標(biāo)注任務(wù)。
后續(xù)操作
智能標(biāo)注結(jié)束后,所有標(biāo)注好的數(shù)據(jù)都存儲在待確認頁面,您可以進去查看智能標(biāo)注好的結(jié)果,進行批量確認。確認完成后,即完成了數(shù)據(jù)標(biāo)注。