華為云數(shù)字人創(chuàng)建聲音
MetaStudio已經(jīng)預(yù)置了各種類型的聲音,如果仍無法滿足用戶的需求,請參考本節(jié)操作,自定義生成聲音。
MetaStudio不支持個人用戶定制聲音,僅支持企業(yè)用戶。
定制聲音時,從平臺下載的授權(quán)書中有明確說明,定制音色需授權(quán)給公司使用。
操作前準(zhǔn)備
用戶創(chuàng)建聲音制作任務(wù)前,需要參考操作步驟準(zhǔn)備如下內(nèi)容:
(可選)參考聲音制作頁面的“錄音指導(dǎo)”,提前錄制生成語料。僅制作聲音,選擇“語料上傳”方式時,需要此語料。
聲音授權(quán)簽署文件。
操作步驟
登錄MetaStudio控制臺。
單擊“聲音制作”下方的“開始創(chuàng)建”,進入聲音制作頁面。
界面左側(cè)是聲音制作頁面,右側(cè)為聲音制作流程。聲音制作錄制教程,可以幫助用戶快速制作聲音。
圖1 定制聲音

配置聲音制作參數(shù)
副文本最多一行
配置聲音制作參數(shù)
|
區(qū)域 |
說明 |
|---|---|
|
請選擇聲音制作服務(wù)
|
系統(tǒng)提供如下聲音制作服務(wù),請選擇一種聲音制作服務(wù)。
每種聲音制作服務(wù)后面都會展示剩余次數(shù),需要保證剩余次數(shù)充足。 其中,進階版和高品質(zhì)聲音制作需要更多語料,訓(xùn)練時長更長,聲音效果更佳。 |
|
定制聲音名稱
|
輸入聲音名稱。 示例:歡快女聲。 |
|
請選擇聲音性別
|
聲音的性別,如下所示:
|
|
選擇語言
|
聲音的語言,包含如下選項:
|
|
選擇聲音標(biāo)簽
|
聲音的標(biāo)簽,包含如下選項: 電商 新聞 營銷 針對上述標(biāo)簽,MetaStudio服務(wù)預(yù)置了相應(yīng)的文案內(nèi)容,如文案樣例(基礎(chǔ)版)、文案樣例(進階版)和文案樣例(高品質(zhì))所示。如果按句錄制方式(僅基礎(chǔ)版和進階版支持),且使用預(yù)置文案,必須選對標(biāo)簽。 |
|
請制作聲音
|
制作聲音的方式為:
如果選擇“語料上傳”的方式,且未使用服務(wù)預(yù)置文案,聲音標(biāo)簽僅作為標(biāo)簽,來區(qū)分聲音使用場景;如果選擇“在線錄音”的方式,服務(wù)會根據(jù)聲音標(biāo)簽,生成其對應(yīng)格式的音頻文件,界面不展示音頻文件格式,用戶可不關(guān)注。 |
|
聲音授權(quán)
|
單擊“授權(quán)書模板”,下載授權(quán)書模板后打印。用戶手寫相關(guān)信息后,重新生成簽署后的pdf文件,或者拍攝成jpg或png格式的圖片后上傳。 授權(quán)書內(nèi)容,可參考授權(quán)書。 |
|
第三方用戶ID(可選)
|
第三方用戶ID,為查詢資產(chǎn)列表接口參數(shù)“X-App-UserId”的值。 僅需調(diào)用查詢資產(chǎn)列表接口,通過參數(shù)“X-App-UserId”過濾查詢2D數(shù)字人模型資產(chǎn)時填寫。 |
|
區(qū)域 |
說明 |
|---|---|
|
請選擇聲音制作服務(wù)
|
系統(tǒng)提供如下聲音制作服務(wù),請選擇一種聲音制作服務(wù)。
每種聲音制作服務(wù)后面都會展示剩余次數(shù),需要保證剩余次數(shù)充足。 其中,進階版和高品質(zhì)聲音制作需要更多語料,訓(xùn)練時長更長,聲音效果更佳。 |
|
定制聲音名稱
|
輸入聲音名稱。 示例:歡快女聲。 |
|
請選擇聲音性別
|
聲音的性別,如下所示:
|
|
選擇語言
|
聲音的語言,包含如下選項:
|
|
選擇聲音標(biāo)簽
|
聲音的標(biāo)簽,包含如下選項: 電商 新聞 營銷 針對上述標(biāo)簽,MetaStudio服務(wù)預(yù)置了相應(yīng)的文案內(nèi)容,如文案樣例(基礎(chǔ)版)、文案樣例(進階版)和文案樣例(高品質(zhì))所示。如果按句錄制方式(僅基礎(chǔ)版和進階版支持),且使用預(yù)置文案,必須選對標(biāo)簽。 |
|
請制作聲音
|
制作聲音的方式為:
如果選擇“語料上傳”的方式,且未使用服務(wù)預(yù)置文案,聲音標(biāo)簽僅作為標(biāo)簽,來區(qū)分聲音使用場景;如果選擇“在線錄音”的方式,服務(wù)會根據(jù)聲音標(biāo)簽,生成其對應(yīng)格式的音頻文件,界面不展示音頻文件格式,用戶可不關(guān)注。 |
|
聲音授權(quán)
|
單擊“授權(quán)書模板”,下載授權(quán)書模板后打印。用戶手寫相關(guān)信息后,重新生成簽署后的pdf文件,或者拍攝成jpg或png格式的圖片后上傳。 授權(quán)書內(nèi)容,可參考授權(quán)書。 |
|
第三方用戶ID(可選)
|
第三方用戶ID,為查詢資產(chǎn)列表接口參數(shù)“X-App-UserId”的值。 僅需調(diào)用查詢資產(chǎn)列表接口,通過參數(shù)“X-App-UserId”過濾查詢2D數(shù)字人模型資產(chǎn)時填寫。 |
- 單擊“提交制作”。
- 彈出“資源消耗提示”對話框。提示用戶目前聲音制作服務(wù)剩余數(shù)量,本次將消耗1個資源。
- 如果用戶確認無誤,單擊“確認提交”。
- 聲音制作任務(wù)提交成功后,界面提示“制作任務(wù)提交成功”,如圖2所示。
- 聲音制作任務(wù)提交成功后,需要等待1天左右的時間審核。任務(wù)審核通過后,啟動聲音制作。
- 圖2 制作任務(wù)提交成功

- 用戶可以單擊“查看制作任務(wù)列表”,查看聲音制作任務(wù)審核進展。
- 當(dāng)狀態(tài)變更為“系統(tǒng)審核完成”,自動啟動算法訓(xùn)練。如果系統(tǒng)存在多個算法訓(xùn)練任務(wù),可能會存在排隊和延遲的現(xiàn)象,請耐心等待。
1分鐘教程讓您快速上手體驗
1分鐘教程讓您快速上手體驗
您只需上傳正面照片,在5秒內(nèi)就能生成自己的專屬風(fēng)格化數(shù)字人形象,低門檻數(shù)字人制作,捏臉制作,所見即所得。
MetaStudio虛擬直播讓用戶無需專業(yè)的動作和昂貴不便的面部捕捉設(shè)備,只需普通的攝像頭就能實現(xiàn)對人體動作和表情的高精度捕捉。
MetaStudio數(shù)字人視頻制作,實現(xiàn)圖片、視頻、文檔一鍵轉(zhuǎn)化,用戶僅需輸入文本或錄入語音,依托華為強大的AI智能功能,快速生成數(shù)字人播報視頻,讓數(shù)字人演繹你的表達。