檢測(cè)到您已登錄華為云國際站賬號(hào),為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
圖2 訓(xùn)練結(jié)果頁面 填寫資產(chǎn)名稱、描述,選擇對(duì)應(yīng)的可見性,單擊“確定”發(fā)布模型。 發(fā)布后的模型會(huì)作為模型資產(chǎn)同步顯示在“空間資產(chǎn) > 模型”列表中。 通過預(yù)訓(xùn)練發(fā)布的模型,支持再次進(jìn)行訓(xùn)練、模型部署。 通過微調(diào)發(fā)布的模型,支持再次微調(diào)、強(qiáng)化學(xué)習(xí)及部署。 父主題: 訓(xùn)練NLP大模型
發(fā)布訓(xùn)練后的CV大模型 CV大模型訓(xùn)練完成后,需要執(zhí)行發(fā)布操作,操作步驟如下: 登錄ModelArts Studio大模型開發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開發(fā) > 模型訓(xùn)練”,單擊模型名稱進(jìn)入任務(wù)詳情頁。 單擊進(jìn)入“訓(xùn)練結(jié)果”頁簽,單擊“發(fā)布”。
發(fā)布訓(xùn)練后的預(yù)測(cè)大模型 預(yù)測(cè)大模型訓(xùn)練完成后,需要執(zhí)行發(fā)布操作,操作步驟如下: 登錄ModelArts Studio大模型開發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開發(fā) > 模型訓(xùn)練”,單擊模型名稱進(jìn)入任務(wù)詳情頁。 單擊進(jìn)入“訓(xùn)練結(jié)果”頁簽,單擊“發(fā)布”。
yaml相對(duì)或絕對(duì)路徑 <model_name>:訓(xùn)練模型名,如qwen2.5-7b <exp_name>:實(shí)驗(yàn)名稱:包含訓(xùn)練策略類型及數(shù)據(jù)序列長(zhǎng)度:【lora:4096-lora、full:4096-full】 訓(xùn)練完成后,test-benchmark目錄下會(huì)生成訓(xùn)練日志及NPU利用率日志及權(quán)重文件,如qwen2
當(dāng)您使用自定義腳本創(chuàng)建算法的時(shí)候,如果您的模型引用了其他依賴,您需要在“算法管理 > 創(chuàng)建算法”的“代碼目錄”下放置相應(yīng)的文件或安裝包。 安裝python依賴包請(qǐng)參考模型中引用依賴包時(shí),如何創(chuàng)建訓(xùn)練作業(yè)? 安裝C++的依賴庫請(qǐng)參考如何安裝C++的依賴庫? 在預(yù)訓(xùn)練模型中加載參數(shù)請(qǐng)參考如何在訓(xùn)練中加載部分訓(xùn)練好的參數(shù)?
優(yōu)化器:常用的優(yōu)化器包括Adam、SGD等,用于調(diào)整模型參數(shù)以最小化損失函數(shù)。 B. 訓(xùn)練過程 批量訓(xùn)練:將訓(xùn)練數(shù)據(jù)分成小批量,逐批輸入模型進(jìn)行訓(xùn)練。 評(píng)估與調(diào)整:在訓(xùn)練過程中,定期評(píng)估模型在驗(yàn)證集上的性能,并根據(jù)需要調(diào)整模型參數(shù)和結(jié)構(gòu)。 下面是一個(gè)訓(xùn)練模型的示例代碼: # 示例訓(xùn)練數(shù)據(jù) X_train
擇攝像機(jī)。 在首頁導(dǎo)航欄,進(jìn)入“模型訓(xùn)練”頁面(選擇攝像機(jī)型號(hào)后,模型訓(xùn)練自動(dòng)解鎖),單擊“華為訓(xùn)練云服務(wù)”進(jìn)入ModelArts模型訓(xùn)練平臺(tái)。如果開發(fā)者有自己訓(xùn)練好的模型, 不需要進(jìn)入該步驟。 其中, ModelArts是面向開發(fā)者的一站式AI開發(fā)平臺(tái),屬于華為云解決方案,需要按照華為云市場(chǎng)要求進(jìn)行注冊(cè)與使用。
斂問題。 訓(xùn)練詳情頁的checkpoint輸出發(fā)布成資產(chǎn)之后,與正常訓(xùn)練結(jié)束的模型產(chǎn)物一致,可以支持增量微調(diào),LoRA微調(diào),部署等功能。 查看訓(xùn)練任務(wù)詳情 模型啟動(dòng)訓(xùn)練后,可以在模型訓(xùn)練列表中查看訓(xùn)練任務(wù)的狀態(tài),單擊任務(wù)名稱可以進(jìn)入詳情頁查看訓(xùn)練結(jié)果、訓(xùn)練任務(wù)詳情和訓(xùn)練日志等。
參數(shù)填寫完成后,單擊“立即創(chuàng)建”。 創(chuàng)建好訓(xùn)練任務(wù)后,頁面將返回“模型訓(xùn)練”頁面,可隨時(shí)查看當(dāng)前任務(wù)的狀態(tài)。 創(chuàng)建NLP大模型增量預(yù)訓(xùn)練任務(wù) 在模型完成創(chuàng)建NLP大模型預(yù)訓(xùn)練任務(wù)預(yù)訓(xùn)練后,可以對(duì)訓(xùn)練后的模型繼續(xù)訓(xùn)練,該過程稱為“增量預(yù)訓(xùn)練”。 創(chuàng)建NLP大模型增量預(yù)訓(xùn)練任務(wù)前,請(qǐng)確保有已完成預(yù)訓(xùn)練的NLP大模型。
管理模型訓(xùn)練作業(yè) 查看訓(xùn)練作業(yè)詳情 訓(xùn)練作業(yè)流程可視化 查看訓(xùn)練作業(yè)資源占用情況 查看模型評(píng)估結(jié)果 查看訓(xùn)練作業(yè)事件 查看訓(xùn)練作業(yè)日志 修改訓(xùn)練作業(yè)優(yōu)先級(jí) 使用Cloud Shell調(diào)試生產(chǎn)訓(xùn)練作業(yè) 保存調(diào)試模式訓(xùn)練作業(yè)鏡像 復(fù)制、停止或刪除訓(xùn)練作業(yè) 管理訓(xùn)練容器環(huán)境變量 查看訓(xùn)練作業(yè)標(biāo)簽
分布式模型訓(xùn)練 分布式訓(xùn)練功能介紹 創(chuàng)建單機(jī)多卡的分布式訓(xùn)練(DataParallel) 創(chuàng)建多機(jī)多卡的分布式訓(xùn)練(DistributedDataParallel) 示例:創(chuàng)建DDP分布式訓(xùn)練(PyTorch+GPU) 示例:創(chuàng)建DDP分布式訓(xùn)練(PyTorch+NPU) 父主題:
訓(xùn)練精度測(cè)試流程圖如下圖所示。 圖1 訓(xùn)練精度測(cè)試流程圖 執(zhí)行訓(xùn)練任務(wù) 創(chuàng)建精度訓(xùn)練benchmark目錄。 # 任意目錄創(chuàng)建 mkdir accuracy-test-benchmark 進(jìn)入上步驟創(chuàng)建目錄執(zhí)行訓(xùn)練命令,可以多次執(zhí)行,按自己實(shí)際情況。 ascendfactory-cli train <cfgs_yaml_file>
變量時(shí),不要使用“MA_”開頭的名稱。 如何修改環(huán)境變量 用戶可以在創(chuàng)建訓(xùn)練作業(yè)頁面增加新的環(huán)境變量,也可以設(shè)置新的取值覆蓋當(dāng)前訓(xùn)練容器中預(yù)置的環(huán)境變量值。 為保證數(shù)據(jù)安全,請(qǐng)勿輸入敏感信息,例如明文密碼。 訓(xùn)練容器中預(yù)置的環(huán)境變量 訓(xùn)練容器中預(yù)置的環(huán)境變量如下面表格所示,包括表
訓(xùn)練服務(wù)評(píng)測(cè) 介紹如何使用benchmark工具對(duì)訓(xùn)練性能(吞吐)、精度(loss、下游打分)開展評(píng)測(cè)對(duì)比,對(duì)比結(jié)果以excel文件呈現(xiàn),方便用戶驗(yàn)證發(fā)布模型的質(zhì)量。評(píng)測(cè)包括以下兩部分: 性能評(píng)測(cè) 精度評(píng)測(cè) 約束限制 訓(xùn)練服務(wù)評(píng)測(cè)目前僅適配了Lite Server環(huán)境部署的微調(diào)(SFT)訓(xùn)練階段。
預(yù)測(cè)大模型預(yù)訓(xùn)練參數(shù)說明 參數(shù)分類 訓(xùn)練參數(shù) 說明 訓(xùn)練配置 選擇模型 可以修改如下信息: 來源:選擇“模型廣場(chǎng)”。 類型:選擇“預(yù)測(cè)大模型”,并選擇訓(xùn)練所用的基礎(chǔ)模型和版本。 訓(xùn)練類型 選擇“預(yù)訓(xùn)練”。 訓(xùn)練參數(shù) 訓(xùn)練參數(shù) 模型訓(xùn)練參數(shù),參考表2。 資源配置 計(jì)費(fèi)模式 選擇訓(xùn)練當(dāng)前任務(wù)的計(jì)費(fèi)模式。
Standard模型訓(xùn)練 在ModelArts訓(xùn)練得到的模型欠擬合怎么辦? 在ModelArts中訓(xùn)練好的模型如何獲??? 在ModelArts上如何獲得RANK_TABLE_FILE用于分布式訓(xùn)練? 在ModelArts上訓(xùn)練模型如何配置輸入輸出數(shù)據(jù)? 在ModelArts上如何提升訓(xùn)練效率并減少與OBS的交互?
管理NLP大模型訓(xùn)練任務(wù) 在訓(xùn)練任務(wù)列表中,任務(wù)創(chuàng)建者可以對(duì)任務(wù)進(jìn)行編輯、克?。◤?fù)制訓(xùn)練任務(wù))、重試(重新訓(xùn)練任務(wù))和刪除操作。 登錄ModelArts Studio大模型開發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開發(fā) > 模型訓(xùn)練”,可進(jìn)行如下操作:
管理CV大模型訓(xùn)練任務(wù) 在訓(xùn)練任務(wù)列表中,任務(wù)創(chuàng)建者可以對(duì)任務(wù)進(jìn)行編輯、啟動(dòng)、克?。◤?fù)制訓(xùn)練任務(wù))、重試(重新訓(xùn)練任務(wù))和刪除操作。 登錄ModelArts Studio大模型開發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開發(fā) > 模型訓(xùn)練”,可進(jìn)行如下操作:
管理預(yù)測(cè)大模型訓(xùn)練任務(wù) 在訓(xùn)練任務(wù)列表中,任務(wù)創(chuàng)建者可以對(duì)任務(wù)進(jìn)行編輯、啟動(dòng)、克?。◤?fù)制訓(xùn)練任務(wù))、重試(重新訓(xùn)練任務(wù))和刪除操作。 登錄ModelArts Studio大模型開發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開發(fā) > 模型訓(xùn)練”,可進(jìn)行如下操作:
1。 訓(xùn)練作業(yè)的資源占用情況系統(tǒng)會(huì)自動(dòng)保存30天,過期會(huì)被清除。 如何查看訓(xùn)練作業(yè)資源使用詳情 在ModelArts管理控制臺(tái)的左側(cè)導(dǎo)航欄中選擇“模型訓(xùn)練 > 訓(xùn)練作業(yè)”。 在訓(xùn)練作業(yè)列表中,單擊作業(yè)名稱進(jìn)入訓(xùn)練作業(yè)詳情頁面。 在訓(xùn)練作業(yè)詳情頁面,單擊“監(jiān)控”頁簽查看訓(xùn)練作業(yè)的資