AI開發(fā)過程中經(jīng)常需要處理海量數(shù)據(jù),數(shù)據(jù)準(zhǔn)備與標(biāo)注往往耗費整體開發(fā)一半以上時間。ModelArts數(shù)據(jù)管理提供了一套高效便捷的管理和標(biāo)注數(shù)據(jù)框架。不僅支持圖片、文本、語音、視頻等多種數(shù)據(jù)類型,涵蓋圖像分類、目標(biāo)檢測、音頻分割、文本分類等多個標(biāo)注場景,可適用于各種AI項目,如計算機視覺、自然語言處理、音視頻分析等;同時提供數(shù)據(jù)篩選、數(shù)據(jù)分析、數(shù)據(jù)處理、智能標(biāo)注、團隊標(biāo)注以及版本管理等功能,AI開發(fā)者可基于該框架實現(xiàn)數(shù)據(jù)標(biāo)注全流程處理。如圖所示。
圖1數(shù)據(jù)標(biāo)注全流程
據(jù)管理的功能.jpg)
ModelArts數(shù)據(jù)管理為 數(shù)據(jù)集 提供聚類分析、數(shù)據(jù)清洗、數(shù)據(jù)增強、數(shù)據(jù)選擇、特征分析等處理,可幫助開發(fā)者進一步理解數(shù)據(jù)、篩選數(shù)據(jù)、挖掘數(shù)據(jù)信息,從而準(zhǔn)備出一份滿足開發(fā)目標(biāo)或項目要求的高價值數(shù)據(jù)。
開發(fā)者可利用數(shù)據(jù)管理提供的各個場景標(biāo)注工具進行數(shù)據(jù)標(biāo)注,也可以選擇多種標(biāo)注方式,包括通過預(yù)置算法或用戶自定義算法訓(xùn)練得到的模型進行智能標(biāo)注,僅需少量人工標(biāo)注和修正則可以得到較準(zhǔn)確的標(biāo)注結(jié)果;通過創(chuàng)建團隊進行多人合作標(biāo)注,提升標(biāo)注效率。滿足個人開發(fā)者的獨立標(biāo)注、小團隊的協(xié)作標(biāo)注,和專業(yè)團隊的大規(guī)模協(xié)同標(biāo)注及項目化管理。
針對大規(guī)模團隊的標(biāo)注,提供專業(yè)的團隊管理、人員管理、數(shù)據(jù)管理,實現(xiàn)從項目創(chuàng)建、分配、管理、標(biāo)注、驗收全流程。針對個人、小團隊、小規(guī)模協(xié)作標(biāo)注,提供便捷易用的標(biāo)注工具,最小化項目管理開銷。
此外,標(biāo)注平臺確保用戶 數(shù)據(jù)安全 性,確保用戶數(shù)據(jù)僅在授權(quán)范圍內(nèi)使用,標(biāo)注對象分配策略確保用戶數(shù)據(jù)的隱私性,實現(xiàn)標(biāo)注數(shù)據(jù)脫敏需求。