對于AI開發(fā)者而言,在開始模型訓練前,都得提前準備大量的數(shù)據(jù),完成數(shù)據(jù)標注后,才能用于AI模型構建。
一般情況下,模型構建對輸入的訓練數(shù)據(jù)都是有要求的,比如圖像分類,一類標簽的數(shù)據(jù)至少20條,否則您訓練所得的模型無法滿足預期。為了獲得更好的模型,標注的數(shù)據(jù)越多,訓練所得的模型質(zhì)量更佳。
正因為如此,數(shù)據(jù)標注的工作顯得有點繁重枯燥,數(shù)據(jù)多,工作重復。
ModelArts主打是一個易用、好用的AI平臺,想AI開發(fā)者所想,智能標注功能,一鍵解決人工標注的煩惱。智能標注功能快速完成數(shù)據(jù)標注,為您節(jié)省70%以上的標注時間。智能標注是指基于當前標注階段的標簽及圖片學習訓練,選中系統(tǒng)中已有的模型進行智能標注,快速完成剩余圖片的標注操作。

一鍵智能標注,怎么用?
- 在ModelArts管理控制臺,選擇“ 數(shù)據(jù)管理 >數(shù)據(jù)集”。
- 創(chuàng)建一個數(shù)據(jù)集,數(shù)據(jù)集類型需選擇“圖像分類”或“物體檢測”類型。
- 單擊數(shù)據(jù)集名稱,進入數(shù)據(jù)集概覽頁。然后,單擊右上角“開始標注”,進入數(shù)據(jù)集詳情頁。
- 在數(shù)據(jù)集詳情頁,單擊“待確認”頁簽,然后單擊“啟動智能標注”。
- 在彈出的“啟動智能標注”對話框中,選擇智能標注類型。
智能標注有兩種類型:
“主動學習”表示系統(tǒng)將自動使用半監(jiān)督學習,難例篩選等多種手段進行智能標注,降低人工標注量,幫助用戶找到難例。同時,可選擇“快速型”或“精準型”的算法類型。“快速型”僅使用已標注的樣本進行訓練;“精準型”會額外使用未標注的樣本做半監(jiān)督訓練,使得模型精度更高。
“預標注”表示選擇用戶模型管理里面的模型,選擇模型時需要注意模型類型和數(shù)據(jù)集的標注類型相匹配。從當前賬號管理的模型列表中選擇一個匹配的模型,用于智能標注。
下圖為“圖像分類”類型的智能標注:

下圖為“物體檢測”類型的智能標注:

- 單擊“提交”后,啟動智能標注。

智能標注有哪些限制
- 目前只有“圖像分類”和“物體檢測”類型的數(shù)據(jù)集支持智能標注功能。
- 啟動智能標注時,需數(shù)據(jù)集存在至少2種標簽,且每種標簽已標注的圖片不少于5張。
- 啟動智能標注時,必須存在未標注圖片。
- 啟動智能標注前,保證當前系統(tǒng)中不存在正在進行中的智能標注任務。
后續(xù)操作
智能標注結(jié)束后,所有標注好的數(shù)據(jù)都存儲在待確認頁面,您可以進去查看智能標注好的結(jié)果,進行批量確認。確認完成后,即完成了數(shù)據(jù)標注。